제주 날씨,인구에 따른 교통량데이터 : 출처 제주 데이터 허브 DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/Jeju.csv’
url =‘https://raw.githubusercontent.com/Datamanim/pandas/main/Jeju.csv’
df = pd.read_csv(url, encoding='euc-kr')
#df.columns == 이렇게 시도했다.
ans = df.select_dtypes(exclude=object).columns
ans = df.select_dtypes(include = object).columns
ans = df['평균속도'].quantile(0.75) - df['평균속도'].quantile(0.25)
ans = df.읍면동명.nunique()
url = 'https://raw.githubusercontent.com/Datamanim/pandas/main/chipo.csv'
quantity컬럼 값이 3인 데이터를 추출하여 index를 0부터 정렬하고 첫 5행을 출력하라
ans = df.loc[df['quantity']==3].head().reset_index(drop=True)
item_price 컬럼의 달러표시 문자를 제거하고 float 타입으로 저장하여 new_price 컬럼에 저장하라
df['new_price'] = df['item_price'].str[1:].astype('float') ans = df['new_price'].head()
new_price 컬럼이 5이하의 값을 가지는 데이터프레임을 추출하고, 전체 갯수를 구하여라
ans = len(df.loc[df.new_price <=5])
item_name명이 Chicken Salad Bowl 인 데이터 프레임을 추출하라고 index 값을 초기화 하여라
ans = df.loc[df.item_name == 'Chicken Salad Bowl'].reset_index(drop=True)
new_price값이 9 이하이고 item_name 값이 Chicken Salad Bowl 인 데이터 프레임을 추출하라
ans = df.loc[(df.new_price <=9) & (df.item_name == 'Chicken Salad Bowl')]
df의 new_price 컬럼 값에 따라 오름차순으로 정리하고 index를 초기화 하여라
ans = df.sotr_values('new_price).reset_index(drop=True)
df의 item_name 컬럼 값중 Chips 포함하는 경우의 데이터를 출력하라
ans = df.loc[df.item_name.str.contains('Chips')]
ans = df.loc[(df.item_name == 'Steak Salad') | (df.item_name == 'Bowl')]
ans = ans.drop_duplicates('item_name')
ans = ans.drop_duplicates('item_name', keep='last')
df.loc[df.item_name == 'Izze','item_name'
ans =df
ans
df.loc[df.choice_description.isnull(),'choice_description'] = 'NoData'
ans = df
ans = len(df.loc[~df.choice_description.str.contains('Vegetables')])
ans
ans = df[df.item_name.str.startswtih('N')]
ans
ans = df[df.item_name.str.len() >=15]
ans.head(3)
st1 = [1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98]
ans = df.loc[df.new_pric.isin(st1)]
display(ans.head(3))
prin(len(ans))
ans = df.groupby('host_name').size()
ans = df.host_name.value_counts().sort_inex()
Ans = df.groupby('host_name').size().\
to_frame().rename(columns={0:'counts'}).\
sort_values('counts',ascending=False)
ans = df.groupby(['neighbourhood_group','neighbourhood'],as_index = False).size()
ans = df.groupby(['nighbourhood_group','neighbourhood'],as_index=False).size()\
.groupby(['neighbourhood_group'], as_index=False).max()
ans = df.groupby(['neighbourhood','neighbourhood_group']).price.mean().unstack()