[혼자 공부하는 머신러닝+딥러닝] - CH.6-3 PCA

Jeonghwan Kim·2022년 11월 15일
0
post-thumbnail

주요 개념

  • 차원 축소: 원본 데이터의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류, 저장공간을 줄이고 시각화하기 쉽고 다른 알고리즘의 성능을 높일 수 있음

  • PCA(주성분 분석): 차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향(주성분)을 찾는 방법, 원본 데이터를 주성분에 투영하여 새로운 특성을 만듦

  • explained variance(설명된 분산): 주성분 분석에서 주성분이 얼마나 원본 데이터의 분산을 잘 나타내는지 기록한 것

  • 차원축소

  • 주성분이 원본 데이터의 분산을 얼마나 잘 나타내는지 기록한 explained variance (설명된 분산)은 explained_variance_ratio에 있음

  • 차원축소된 데이터로 K-MEANS 알고리즘 클러스터 찾아보기

  • cluster 별로 나누어 산점도 그리기

colab 링크: https://colab.research.google.com/drive/1v7e1WK_TquhPaRP8JyGwI4NV_bArQ7ad?usp=sharing

참고: 혼자 공부하는 머신러닝+딥러닝

0개의 댓글