26강. Dimesionality Reduction & PCA

이찬·2023년 9월 13일

  • 비지도학습 - 차원축소 => PCA

  • data에 있는 열을 줄여주는 기법

  • 기존의 열에서 원하는 일부 열을 선택하는 feature selection

  • 기존의 열을 바탕으로 새로운 열을 만들어 소수의 열로 구성하는 feature extraction

  • 기존의 열에서 새로운 열을 추가 / 새로운 열로 기존의 열을 대체하는 방법도 feature extraction

  • 새로 만들어낸 열 : Pricipal Component Analysis

  • 전체 data 중 가장 분산이 높은 방향으로 회전 변환 진행 : 끝과 끝을 연결하는 벡터 & 그 축을 중심으로 직교하는 방향으로 데이터의 끝과 끝을 연결하는 벡터
    => 더 작은 차원으로 데이터를 압착시킴

  • Projection

  • 차원을 줄였음에도 data의 분포 정보는 남아있음

  • 몇 개까지의 principle을 만들까! => 1 ~ (원본 - 1)개까지!

  • PCA = 전처리

선형대수의 꽃

  • 행렬 분해 decomposition
  • pca projection 시각화
  • SVD

몇 개의 Principal Component 주성분이면 충분한가?

np.argmax : 최대값의 인덱스를 리턴

  • False : 0
  • True : 1

np.cumsum : 누적된 합계를 계산

profile
Kyunghee univ. IE 21

0개의 댓글