❗ K-means Clustering이 Data Science에서 정말 중요하다
Q . 표준화란?
A . 표준화는 데이터의 평균을 0, 분산 및 표준편차를 1로 만들어준다.
- Q . 표준화를 하는 이유?
A .
- 서로 다른 통계 데이터들을 비교하기 용이하기 때문에
- 표준화를 하면 평균은 0, 분산과 표준편차는 1로 만들어 데이터의 분포를 단순화 시키고, 비교를 용이하게한다.
# StandardScaler로 데이터 정규화
scaler = StandardScaler()
df_std = scaler.fit_transform(df)