데이터에 대한 특성을 이해한 뒤 어떤 모형을 적용해서 분석할 것인지 결정할 수 있다. 모형을 선택하는 기준과 가설검정 과정을 대략적으로 살펴보자.
가설 을 명확히 규명한다.차이 를 검정하고 싶은 것인지, 관계 를 검정하고 싶은 것인지 구분한다. 차이 : 집단 간 평균의 차이관계 : 함수적 관계연속형 vs 이산형 인지에 따라 결정종속변수와 독립변수의 종류에 따라 통계 분석법과 귀무가설이 어떻게 달라지는 지 살펴보자.
(*대립가설이 가설검정을 통해 알고싶은 사실이다.)
| 종속변수 (반응변수) | 독립변수(설명변수) | 통계분석법 | 귀무가설 |
|---|---|---|---|
| 연속형 | 범주형(2개 범주) | T-검정, paired T-검정 | 집단 간 평균이 동일 |
| 연속형 | 범주형(3개 이상) | 분산분석(ANOVA) | 집단 간 평균이 동일 |
| 연속형 | 연속형 | 회귀분석 | 회귀 계수 = 0 |
| 연속형 | 혼합(수치형+범주형) | 공분산분석(ANCOVA) | |
| 범주형 | 범주형 | 검정/로짓분석 | 집단 간 연관성이 없음/ 회귀 계수 = 0 |
| 범주형 | 혼합(수치형+범주형) | 로짓분석 | |
| 생존시간 | 혼합(수치형+범주형) | 생존분석 |
종속변수가 연속형 일때와 이산형 일때 두 글에 나눠서 정리해본다.