주제: 이때까지 배웠던 내용 중 내가 자주 까먹거나 굉장히 자주 사용하는 것들 위주로 코드 정리
단일 열 정렬
data.sort_valeus(by = 'MonthyIncome', ascending = False)
복합 열 정렬
data.sort_values(by=['JobSatisfaction', 'MonthlyIncome'], ascending=[True, False])
MaritalStatus 열 고유값 개수 확인
print(data['MaritalStatus'].value_counts())
빈도수 체크(normalize=True)
data['Activity'].value_counts(normalize=True)
MaritalStatus 별 Age 평균 --> 시리즈
data.groupby('MaritalStatus', as_index=True)['Age'].mean()
MaritalStatus 별 Age 평균 --> 데이터프레임
data.groupby('MaritalStatus', as_index=True)[['Age']].mean()
MaritalStatus 별 Age 평균 --> 데이터프레임
data.groupby('MaritalStatus', as_index=False)[['Age']].mean()
data.groupby('MaritalStatus', as_index=False)[['Age','MonthlyIncome']].mean()
'MaritalStatus', 'Gender'별 나머지 열들 평균 조회
data_sum=data.groupby(['MaritalStatus', 'Gender'], as_index=False)[['Age','MonthlyIncome']].mean()
대부분 이러한 방식으로 나온다.
pd.merge(df1, df2, on = 'A')
히스토그램 -> sns.histplot(x= 'Fare', data = titanic, bins = 20)
Density plot -> sns.kdeplot(titanic['Fare'])
Box plot -> plt.boxplot(temp['Age'])
범주별 빈도수
titanic['Embarked'].value_counts()
범주별 비율
titanic['Embarked'].value_counts(normalize = True)
bar chart
- seaborn의 countplot
- plt.bar() 를 이용하려면 먼저 집계한 후 결과 가지고 그래프 그려야
- countplot은 집계 + bar plot을 한꺼번에 해결
sns.countplot(x = 'Pclass', data = titanic)
plt.grid()
plt.show()