[Adsp] 3-6. 다변량 분석과 PCA

Mini·2022년 8월 19일
0

ADsP

목록 보기
12/17

(1) 다차원 척도법 (MDS)

  • 객체 간의 근접성을 시각화하는 통계 기법, 군집 분석과 유사
  • 객체들 사이에 유사성 혹은 비유사성을 측정 -> 원래의 차원보다 낮은 차원의 공간에 군집 부석처럼 점으로 표현
  • 데이터를 추소하는 목적으로 사용
  • 유클라디안 거리 행렬로 사용하여 계산
  • 데이터의 변수가 연속형 변수 혹은 서열척도여야 함.
  • stress 척도 사용
    0~1 사이의 값
    그 값이 낮을수록 적합도가 높다고 평가
    * 0.05이내 -> 적합도 좋다, 0.15이상 ->적합도 매우 나쁘다

    (2) 주성분분석 (PCA)

  • 여러 개의 변수 중 서로 상관성이 높은 변수들의 선형결합 -> 새로운 변수 (주성분)을 만들어 변수를 요약 및 축소하는 분석 방법
  • 변수를 축소하여 모델 설명령 높임, 다중공선성 문제 해결, 군집 분석 시 모형 성능을 높일 수 있음, 주성분 분석시 선형변환 필요
  • 주성분의 개수는 전체 데이터의 70%이상을 설명할 수 있도록 선택
  • 손실되는 정보가 최소가 되도록 분산이 가장 큰 축을 찾는 것

0개의 댓글