
9/25 5세션
산술평균, 기하평균, 조화평균
# 넘파이 사용
np.mean(titanic['Fare'])
# 판다스 사용
titanic['Fare'].mean()
자료의 순서 상 가운데 위치한 값
# 넘파이 사용
np.median(titanic['Fare'])
# 판다스 사용
titanic['Fare'].median()
가장 빈번한 값
# 판다스 사용
titanic['Pclass'].mode()
air['Ozone'].describe()

TIP! 평균을 대표값으로 사용할 때의 주의점
작은 값, 큰 값만 많은 경우가 있다!
수치형 변수의 분포를 볼 때 사용
plt.hist() 형으로 사용bins : 구간 개수 변경# matplotlib 사용
plt.hist(titanic.Fare, bins = 5, edgecolor = 'gray')
plt.xlabel('Fare')
plt.ylabel('Frequency')
plt.show()
# seaborn 사용
sns.histplot(x= 'Fare', data = titanic, bins = 20)
plt.show()

bins 를 변경하면서 그리기

TIP! seaborn 의 장점
seaborn 은 x label, y label, edgecolor 가 자동으로 지정된다
sns.kdeplot(titanic['Fare'])
# sns.kdeplot(x='Fare', data = titanic)
plt.show()
히스토그램 & Kde
sns.histplot(x='Age', data=titanic, kde=True)
plt.show()

박스와 수염으로 구성# matplotlib 사용
plt.boxplot(temp['Age'])
plt.grid()
plt.show()
# seaborn 사용 - NaN 이 자동으로 제외됨
sns.boxplot(x = titanic['Age'])
plt.grid()
plt.show()
