[ML] 8주차-2 : Dimensionality reduction

k_dah·2021년 11월 30일

MachineLearning_AndrewNg

목록 보기

20/32

Machine Learning by professor Andrew Ng in Coursera

'Data Compression를 왜 하는지에 대해 '

데이터를 $2D$ 에서 $1D$ 로 줄인다.

예를 들어 비행기 조종사에 관한 data가 있을 때.
$\text{feature1: pilot skill}$ & $\text{feature2: pilot's joyment}$ 라면
이 두 특성을 $\text{aptitude}$ 라는 특성 1개로
축소할 수 있다.

모든 원본 데이터들을 어떤 직선으로 내린다.
'정사영, projection'
'approximation of original training set'
이제 데이터를 표현할 때 숫자 2개가 아닌 1개만 필요.
memory&space requirement 가 전부 줄어든다.
learning algorithm을 더 빨리 실행할 수 있다.

데이터를 $3D$ 에서 $2D$ 로 줄인다.
'실전에서는 10000D에서 100D로 줄이는 상황도 생긴다.'