PCA

PCA는 고차원의(feature가 많은) x에 대해서 주어진 x들의 분포를 가장 잘 설명하는
x축, y축을 찾아내는 기술이다.

데이터가 퍼져있는 사진이다.

분포가 많은 가로부분을 x축, 그 직교를 이루는 부분을 y축으로 한다.
이렇게 새로운 x축과 y축을 찾아낸 뒤,
우리가 가진 데이터를 새로운 축에 나타낼 수 있다.

하지만 이런 경우 x축과 y축 label을 명확히 하기 어렵다는 단점이 있다.

(기존에 x축은 키, y축은 몸무게라고 했을때, 새로운 축은 그 기준을 찾기가 어려움.)

0개의 댓글