제로베이스_Machine Learning (10)

KulangK·2023년 8월 31일
0

Machine Learning

목록 보기
10/13
post-thumbnail

📄 목차

  1. PCA (Principal Component Analysis)
    • PCA란?
    • 실습 (임의의 수들, iris, wine)
  2. PCA eigenface

1. PCA (Principal Component Analysis)

PCA란?

  • PCA
    • 차원축소 (dimensionality reduction)와 변수추출 (feature extraction) 기법으로 널리 쓰이고 있는 주성분 분석
    • 데이터의 분산을 최대한 보존하면서 서로 직교하는 새 기저/축을 찾아, 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 기법
      • 다차원의 데이터 셋을 다양한 시각에서 봤을 때 관련성을 보이도록 표현하는 방식
    • 변수추출은 기존 변수를 조합해 새로운 변수를 만드는 기법
      (EDA나 머신러닝을 통해 관련있는 변수만 선택하는 것과는 다름)

실습 (임의의 수들, iris, wine)

임의의 수들


Iris Data


Wine Data


2. PCA eigenface

  • 데이터: sklearn에서 제공하는 Olivetti 데이터
    • AT&T, 캠브리지 대학의 공동 연구 데이터
  • 흐름:
    데이터 읽기 >> 원본 데이터 확인 >> PCA 진행 >> PCA inverse하여 데이터 확인
    component 나누어 변경 후 확인 >> component 모두 변경 후 확인
  • 목적: image를 통해 PCA 이해 높이기

profile
새싹 데이터 분석가 https://github.com/KulangK

0개의 댓글