다변량 해석 기초

백승하·2024년 4월 15일

다변량해석

목록 보기
1/6
post-thumbnail

다변량해석(Multivariate Analysis)

다변량은 분포적인 변수는 없지만 결과값이 여러가지 있는 것으로 다변량해석이란 조사 중인 각 개인 혹은 각 대상물에 대한 다수의 측정치를 동시에 분석하는 모든 통계적 방법이라 볼 수 있다. 다시 말해 두 개의 변수 이상을 동시에 분석하는 것이다.

다변량 분석 종류

R-techniques : 주성분분석(Principle component analysis), 요인분석(Factor analysis)
Q-techniques: 판변분류분석(Discriminant and Classification analysis), 군집분석(Cluster analysis)
Visualization techniques: 행렬도(Biplots), 대응분석(Correspondence analysis)

1 ) 주성분 분석
새롭게 정의된 변수 -> 이 변수에 대한 정의가 필요함

변수 간의 상관관계가 있는 다차원의 데이터를 효율적으로 저차원의 데이터로 요약하는 방법

2 ) 요인 분석
가상의 변수들로 현재 변수가 이루어졌다고 여김, 이 가상의 변수(=요인)을 찾는 것을 목적으로 함

요인분석은 많은 수의 변수들 간 상호관련성을 분석하고, 이들 변수들을 어떤 공통 요인들로 설명하고자 할 때 이용되는 기법이다. 즉, 요인분석은 많은 수의 원래 변수들을 이보다 적은 수의 요인으로 요약하기 위한 분석기법이다.

3 ) 정준 분석
머리 관련 치수들, 팔다리 관련 치수들 같이 각각의 결과의 선형결합물의 상관분석

정준상관분석은 하나의 계량적 종속변수와 다수의 계량적 독립변수 간의 관련성을 조사하는 다중회귀분석을 논리적으로 확대시킨 것이라 볼 수 있다.

4 ) 대응 분석
두 범주형 변수 사이의 관계를 알려주는 다변량 통계 기법으로 수치형이 아닌 범주형 자료들의 분할표 만들어 카이제곱 검정으로 자료간 관계성 파악

5 ) 군집 분석
섞인 자료들의 특징을 가지고 구분

군집분석은 집단에 관한 사전정보가 전혀 없는 각 표본에 대하여 그 분류체계를 찾을 때, 다시 말해 각 표본을 표본들 간의 유사성에 기초에 한 집단에 분류시키고자 할 때 사용되는 기법으로 판별분석과 달리 군집분석에서는 집단이 사전에 정의되어 있지 않다.

6 ) 판별 분석
종속변인이 2개 혹은 그 이상의 집단으로 구성되어 있을 때 여러 개의 독립변인으로 집단구성원을 판별 혹은 예측하기 위한 통계적 방법으로 나뉜 자료를 기준으로 어느 집단에 닿을지 규칙을 정함

다항분포

다변량 정규분포

0개의 댓글