
비지도학습 - 차원축소 => PCA

data에 있는 열을 줄여주는 기법
기존의 열에서 원하는 일부 열을 선택하는 feature selection
기존의 열을 바탕으로 새로운 열을 만들어 소수의 열로 구성하는 feature extraction
기존의 열에서 새로운 열을 추가 / 새로운 열로 기존의 열을 대체하는 방법도 feature extraction
새로 만들어낸 열 : Pricipal Component Analysis
전체 data 중 가장 분산이 높은 방향으로 회전 변환 진행 : 끝과 끝을 연결하는 벡터 & 그 축을 중심으로 직교하는 방향으로 데이터의 끝과 끝을 연결하는 벡터
=> 더 작은 차원으로 데이터를 압착시킴
Projection
차원을 줄였음에도 data의 분포 정보는 남아있음
몇 개까지의 principle을 만들까! => 1 ~ (원본 - 1)개까지!
PCA = 전처리
선형대수의 꽃
- 행렬 분해 decomposition


np.argmax : 최대값의 인덱스를 리턴
- False : 0
- True : 1
np.cumsum : 누적된 합계를 계산