R을 이용해 검정을 해보자
: 모집단의 분산을 알고 있는 경우, 모집단의 평균이 표본평균과 차이가 있는지 검정

| pnorm(q, mean, sd, ...) |
|---|
| stats패키지의 pnorm함수는 누적분포함수 값 계산 함수 q : 확률변수 값 mean : 평균(기본 0) sd : 표준편차(기본 1) |

: 독립변수가 범주형이고, 종속변수가 수치형일 경우 두 집단 평균 비교, 모분산을 모를 때
단일표본 T-검정
: 한 집단의 평균이 모집단의 평균과 같은지 검정

| shapiro.test(data) |
|---|
| 단일표본 T-검정을 수행하기 전 표본에 대한 정규성 검정 H0 : 정규분포 따름 H1 : 정규분포를 따르지 않음 |
정규성 가정 시
| t.test(x, alternative, mu) |
|---|
| x : 표본으로부터 관측한 값 alternative : 검정 방향(two.sided, less, greater) mu : 검정 시 기준이 되는 값(μ_0) |
| T검정 결과 변수 | 설명 |
|---|---|
| statistic | t-검정 통계값(t) |
| parameter | 자유도(df) |
| p.value | p값 |
| conf.int | 지정된 대체 가설에 적합한 평균 신뢰구간 |
| estimate | 추정된 평균 |
| stderr | 평균 표준 오차 |

정규성 만족 X시
| wilcox.test(x, alternative, mu) |
|---|
| x : 표본으로부터 관측한 값 alternative : 검정 방향(two.sided, less, greater) mu : 검정 시 기준이 되는 값(μ_0) |
| 윌콕슨 검정 결과 변수 | 설명 |
|---|---|
| statistic | wilcox 검정 통계값(V) |
| parameter | 검정 통계량의 정확한 분포를 위한 파라미터 |
| p.value | p값 |
| alternative | 대안 가설 설명 문자열 |

쌍체표본 T-검정
: 한 집단에서 처치를 받기 전과 후의 차이를 알아보는 검정

| t.test(x, y, alternative, paired, m) |
|---|
| x, y : 표본으로부터 관측한 값 alternative : 검정 방향(two.sided, less, greater) paired : 쌍체표본 T검정을 수행할지 여부(기본 F) m : 검정 시 기준이 되는 값(기본 0) (쌍체표본 T검정은 모평균 차이가 0인지 검정하기 때문에 입력 안해도 괜찮음) |

독립표본 T-검정
: 독립된 두 집단의 평균 차이 검정
| 표본의 수 | 정규성 증명 방법 |
|---|---|
| 10개 미만 | 비모수적 방법인 만-위트니 검정(Mann-Whitney Test) 적용 |
| 10개이상~30개미만 | 샤피로-윌크 검정(Shaprio-Wilk Test), 콜모고로프-스미르노프 검정(Kolmogorov-Smirnov Test)로 정규성 증명 |
| 30개 이상 | 중심극한정리로 정규성 증명 |

| var.test(x, y, alternative) |
|---|
| 등분산 검정 또는 F-검정 |
| var.test(formula, data, alternative) |
|---|
| 등분산 검정 formula : 데이터 프레임을 var.test 함수에 적용시킬 때 사용 |
| t.test(x, y, alternative, var.equal) |
|---|
| 독립표본 T-검정 var.equal : 등분산성 가정 만족 여부(기본 F) |
| t.test(formula, data, alternative, var.equal) |
|---|
| 독립표본 T-검정 |

: 두 표본의 분산에 대한 차이가 유의한지 판별

| var.test(x, y, alternative) |
|---|
| F-검정 |

: 범주형 자료 간의 차이를 보여주는 것으로, 관찰 빈도와 기대 빈도가 유의하게 다른지 검정
| chisq.test(x, y, p, ...) |
|---|
| x : 수치형 벡터 또는 행렬 y : 수치형 벡터(x가 행렬이면 무시) p : x와 동일한 크기를 갖는 확률 벡터. 적합도 검정에서 사용 |
적합도 검정
: 표본 집단의 분포가 주어진 특정 분포를 따르는지 검정
자유도 = 범주의 수 -1
독립성 검정
: 범주가 두 개 이상의 범주로 분할된 경우 사용, 각 범주가 서로 독립적인지 연관성이 있는지 검정
자유도 = (범주1 수 -1)x(범주2 수-1)귀무가설(H0) : 독립적대립가설(H1) : 연관성o학년이라는 범주형 데이터와 선호 과목이라는 범주형 데이터가 서로 연관성이 있는지 검정시
동질성 검정
: 각각의 독립적인 부모집단으로부터 정해진 표본의 크기만큼 추출시, 관측값들이 정해진 범주 내에서 서로 동질한지 여부 검정
귀무가설(H0) : 동질함