이 시리즈에서는 수업 시간에 과제로 나왔던 미니 프로젝트들에 대해서 기록하는 공간을 가지도록 할 예정이다.
import pandas as pd
df = pd.read_csv("/content/drive/MyDrive/AI 스쿨 파일/데이터 분석/chipotle.tsv", sep="\t")
df.info()
df.head()
2. 데이터 전처리 진행
df.isnull().sum()
df.drop('choice_description', axis=1, inplace=True)
df['item_price'] = df['item_price'].str.replace('$', '')
df['item_price'] = pd.to_numeric(df['item_price'])
import pandas as pd
df = pd.read_csv("/content/drive/MyDrive/AI 스쿨 파일/데이터 분석/chipotle.tsv", sep="\t")
df.info()
df.isnull().sum()
df.head()
df.drop('choice_description', axis=1, inplace=True)
df['item_price'] = df['item_price'].str.replace('$', '')
df['item_price'] = pd.to_numeric(df['item_price'])
df1 = df.groupby('item_name').sum()
df1.head(10)
df1['quantity'].nlargest(10).plot.barh()
import matplotlib.pyplot as plt
plt.title('The popular menu top 10')
plt.rc('font', family='AppleGothic')
plt.xlabel('총 주문건수')
plt.ylabel('메뉴명')
df1 = df.groupby('item_name').sum()
df1.head()
df1['item_price'].nlargest(10).plot.barh()
plt.rc('font', family='AppleGothic')
plt.title('The profitable menu top10')
plt.xlabel('총 매출 금액')
plt.ylabel('메뉴명')
df1.plot(x= 'quantity', y= 'item_price', kind='scatter')
plt.rc('font', family='AppleGothic')
plt.title('메뉴의 인기와 매출의 상관관계')
plt.xlabel('메뉴별 주문수')
plt.ylabel('메뉴별 총 매출')
plt.show()
df1[['quantity', 'item_price']].corr()
df2 = df.groupby('order_id').sum()
df2.head()
df2['item_price'].nlargest(20).plot.bar(rot=45)
plt.rc('font', family='AppleGothic')
plt.title('매출 상위 20 주문번호')
plt.xlabel('주문 번호')
plt.ylabel('매출액')
df2['item_price'].plot.box(showfliers=False)
import matplotlib.pyplot as plt
plt.rc('font', family='AppleGothic')
plt.title('주문당 매출액 분포')
df2['item_price'].plot.line()
df2 = df.groupby('order_id').sum()
df2.head()
df3 = df2.value_counts('quantity')
df3.head()
df3.nlargest(7).plot.pie(autopct='%.1f%%', figsize=(10,10))
import matplotlib.pyplot as plt
plt.rc('font', family='AppleGothic')
plt.title('1회 주문 시 주문 메뉴 개수')