데이터 분석 39일
"너무 어려운 차원축소 간단하게 포인트만 정리해 본다"
→ 데이터에 변수가 너무 많으면 이런 문제가 생김
→ 그래서 핵심정보만 뽑고 변수 수를 줄여서:
| 방법 | 특징 | 쉽게 기억 |
|---|---|---|
| PCA | 선형(직선 느낌), 계산 빠름, 단순 | 엑셀 차트 정리 느낌 |
| t-SNE | 비선형(구불구불한 데이터 정리), 예쁘게 군집 나눔 | 그룹끼리 모여보이게 |
| UMAP | t-SNE랑 비슷한데 더 빠름, 큰 데이터에 좋음 | 빠르고 깔끔하게 군집 나눔 |
| 상황 | 추천 |
|---|---|
| 변수 많고 단순하게 줄이고 싶다(정렬 깔끔) | PCA |
| 데이터 모양 복잡 & 군집 시각화 하고 싶다(동네별로 모여있음) | t-SNE |
| 군집 시각화 + 속도 빠르게(t-SNE 느낌인데 속도 Good) | UMAP |