arr = np.arange(12).reshape(3,4)
df = pd.DataFrame(arr, index=range(1,4), columns=['t','e','s','t'])
실행결과
df.head(2)
df.tail(2)
df.describe()
df.info()
실행결과
df['e']
df.e
실행결과
df.iloc[1]
df.iloc[:,1]
df.iloc[:,1:3]
실행결과
df.loc[1]
df.loc[:,'e']
실행결과
df = pd.DataFrame([[1, 2.345], [3.456, 4.567]])
def doubling(x):
return x*x
df.applymap(doubling)
df.apply(lambda x: x*x)
실행결과
df_left = pd.DataFrame({'KEY' : ['K0', 'K1', 'K2', 'K3'],
'A' : ['A0', 'A1', 'A2', 'A3'],
'B' : [0.1, 0.2, 0.3, 0.4]})
df_right = pd.DataFrame({'KEY' : ['K2', 'K3', 'K4', 'K5'],
'C' : ['C2', 'C3', 'C4', 'C5'],
'D' : ['D2', 'D3', 'D4', 'D5']})
df = pd.merge(df_left, df_right, how='outer', on='KEY')
실행결과
df.isnull()
df.notnull()
실행결과
df.isnull().sum()
실행결과
df.isnull().sum(axis=1)
실행결과
df.fillna(0)
df.fillna('missing')
실행결과
df.fillna(df.mean())
df.dtypes
실행결과
df123 = pd.DataFrame({
'city':['서울','서울','서울','서울','부산','부산','부산'],
'fruits':['apple','orange','banana','banana','apple','apple','banana'],
'price':[100,200,250,300,150,200,400],
'quantity':[1,2,3,4,5,6,7']
})
df.groupby('city').mean()
실행결과
df.groupby('KEY').count()
df.groupby('KEY').size()
df['KEY'].value_counts()
실행결과
실행결과
df123.groupby(['city','fruits']).sum()
df123.groupby(['city','fruits'])['fruits'].count()
실행결과
df123.groupby(['city','fruits'])['price'].sum()
df123.groupby(['city','fruits'])['price'].sum().unstack()
df123.groupby(['city','fruits'])['price'].sum().reset_index()
실행결과