자료 유형에 따른 통계 분석

findingflow·2021년 9월 4일
0

Statistics

목록 보기
1/3

데이터에 대한 특성을 이해한 뒤 어떤 모형을 적용해서 분석할 것인지 결정할 수 있다. 모형을 선택하는 기준과 가설검정 과정을 대략적으로 살펴보자.

분석 모형 선택 기준

  • 분석하고자 하는 내용 즉, 가설 을 명확히 규명한다.
  • 가설에 맞는 데이터의 변수 척도를 파악한다.
    • 변수의 척도에 따라 적용할 수 있는 모형이 정해진다.
  • 분석하고자 하는 주제, 가설이 차이 를 검정하고 싶은 것인지, 관계 를 검정하고 싶은 것인지 구분한다.
    • 차이 : 집단 간 평균의 차이
      ex) 고객 만족도 데이터에서 이탈여부(0:이탈안함, 1:이탈)에 따라 고객 만족도가 다른지 검정
    • 관계 : 함수적 관계
      ex) 마케팅의 투자비용이 매출에 미치는 영향을 검정
  • 종속변수의 종류 연속형 vs 이산형 인지에 따라 결정
    • 종속변수 YY 가 연속형일 때
      • 차이 : T-test, Anova(분산분석)
      • 관계 : Regression (회귀분석)
    • 종속변수 YY 가 이산형일 때
      • 차이 : Chi-square Independence Test (카이제곱 독립성검정)
      • 관계 : Logistic Regression (로지스틱 회귀분석)

변수의 종류에 따른 통계 분석

종속변수와 독립변수의 종류에 따라 통계 분석법과 귀무가설이 어떻게 달라지는 지 살펴보자.
(*대립가설이 가설검정을 통해 알고싶은 사실이다.)

YY 종속변수 (반응변수)XX 독립변수(설명변수)통계분석법귀무가설
연속형범주형(2개 범주)T-검정, paired T-검정집단 간 평균이 동일
연속형범주형(3개 이상)분산분석(ANOVA)집단 간 평균이 동일
연속형연속형회귀분석회귀 계수 = 0
연속형혼합(수치형+범주형)공분산분석(ANCOVA)
범주형범주형χ2χ2검정/로짓분석집단 간 연관성이 없음/ 회귀 계수 = 0
범주형혼합(수치형+범주형)로짓분석
생존시간혼합(수치형+범주형)생존분석

종속변수가 연속형 일때와 이산형 일때 두 글에 나눠서 정리해본다.




Reference/Source

profile
Data Analyst

0개의 댓글