머신러닝(4) - 차원축소 간단 정리

hyun-jin·2025년 4월 15일

데이터 분석

목록 보기
43/100

데이터 분석 39일

"너무 어려운 차원축소 간단하게 포인트만 정리해 본다"


1. 차원추소 왜 하는거야?

→ 데이터에 변수가 너무 많으면 이런 문제가 생김

  • 처리 오래 걸림
  • 노이즈(쓸데없는 변수) 많음
  • 그래프로 보기 힘듦

그래서 핵심정보만 뽑고 변수 수를 줄여서:

  • 깔끔하게 정리
  • 빠르게 처리
  • 그래프로 보기 쉽게

2. 방법 3개만 기억!

방법특징쉽게 기억
PCA선형(직선 느낌), 계산 빠름, 단순엑셀 차트 정리 느낌
t-SNE비선형(구불구불한 데이터 정리), 예쁘게 군집 나눔그룹끼리 모여보이게
UMAPt-SNE랑 비슷한데 더 빠름, 큰 데이터에 좋음빠르고 깔끔하게 군집 나눔


3. 예시로 정리하면

상황추천
변수 많고 단순하게 줄이고 싶다(정렬 깔끔)PCA
데이터 모양 복잡 & 군집 시각화 하고 싶다(동네별로 모여있음)t-SNE
군집 시각화 + 속도 빠르게(t-SNE 느낌인데 속도 Good)UMAP

💭 머신러닝도 어려운데 차원축소는 훨 어렵다...

0개의 댓글