[Today I Learned]
Warm-up
- PCA++
- Scree plot
- Hierarchical Clustering
Session - n134
- 지도 학습 (Supervised) vs 비지도 학습 (Unsupervised)
- 강화 학습 (Reinforcement Learning)
- Clustering
- Clustering의 종류
- 유사도 (Similarity)
- Euclidean
- Cosine
- Jaccard
- Edit Distance
- K-Means Clustering
- K-means에서 K를 결정하는 방법
- The Eyeball Method
- Elbow method
과제
<과제 하면서 새롭게 배운 내용>
- Dendrogram(계층도)을 활용한 hierarchical clustering 시각화
- 군집 간 거리 측정 방식
Centroid : 두 중심점의 거리를 군집간의 거리로 측정
Single : 데이터 사이 거리를 측정해서 가장 최소 거리를 기준으로 군집 거리를 측정
Complete : 두 클러스터상에서 가장 먼 거리를 이용해서 측정하는 방식
Average : 데이터들 간 모든 거리들의 평균을 군집간 거리로 정의
Ward : 군집 내 편차들의 제곱합을 기준으로 최소 제곱합을 가지게 되는 군집끼리 연결