데이터에 대한 답이 주어지지 않을 상태에서 컴퓨터를 학습시키는 방법
데이터를 비슷한 특성끼리 묶는 군집과 차원축소로 나눠진다.
데이터 과학자들이 데이터를 더 잘 이해하고 싶을 때 탐색적 분석 단계에서 많이 사용한다.
데이터를 새롭게 표현하여 원래 데이터보다 쉽게 해석할 수 있도록 만드드 작업
고차원의 데이터의 특성의 수를 줄이면서 필요한 특징을 포함한 데이터로 표현해주는 작업이다.
즉, 데이터의 의미를 제대로 표현하는 특징을 추려내는 것이다.
이는 차원의 저주(고차원의 공간을 직관적으로 상상하기 어려움)를 줄이기 위해 사용한다.
투영 : 3차원의 공간상의 데이터를 2차원의 부분 공간으로 투영하게 만든 데이터 셋
PCA : 주성분 분석. 대표하는 주성분을 추출해 차원을 축소하는 기법.