R을 이용해 검정을 해보자
: 모집단의 분산
을 알고 있는 경우, 모집단의 평균
이 표본평균
과 차이가 있는지 검정
pnorm(q, mean, sd, ...) |
---|
stats패키지의 pnorm함수는 누적분포함수 값 계산 함수 q : 확률변수 값 mean : 평균(기본 0) sd : 표준편차(기본 1) |
: 독립변수가 범주형
이고, 종속변수가 수치형
일 경우 두 집단 평균
비교, 모분산
을 모를 때
단일표본 T-검정
: 한 집단의 평균
이 모집단의 평균
과 같은지 검정
shapiro.test(data) |
---|
단일표본 T-검정을 수행하기 전 표본에 대한 정규성 검정 H0 : 정규분포 따름 H1 : 정규분포를 따르지 않음 |
정규성 가정 시
t.test(x, alternative, mu) |
---|
x : 표본으로부터 관측한 값 alternative : 검정 방향(two.sided, less, greater) mu : 검정 시 기준이 되는 값(μ_0) |
T검정 결과 변수 | 설명 |
---|---|
statistic | t-검정 통계값(t) |
parameter | 자유도(df) |
p.value | p값 |
conf.int | 지정된 대체 가설에 적합한 평균 신뢰구간 |
estimate | 추정된 평균 |
stderr | 평균 표준 오차 |
정규성 만족 X시
wilcox.test(x, alternative, mu) |
---|
x : 표본으로부터 관측한 값 alternative : 검정 방향(two.sided, less, greater) mu : 검정 시 기준이 되는 값(μ_0) |
윌콕슨 검정 결과 변수 | 설명 |
---|---|
statistic | wilcox 검정 통계값(V) |
parameter | 검정 통계량의 정확한 분포를 위한 파라미터 |
p.value | p값 |
alternative | 대안 가설 설명 문자열 |
쌍체표본 T-검정
: 한 집단에서 처치를 받기 전
과 후
의 차이를 알아보는 검정
t.test(x, y, alternative, paired, m) |
---|
x, y : 표본으로부터 관측한 값 alternative : 검정 방향(two.sided, less, greater) paired : 쌍체표본 T검정을 수행할지 여부(기본 F) m : 검정 시 기준이 되는 값(기본 0) (쌍체표본 T검정은 모평균 차이가 0인지 검정하기 때문에 입력 안해도 괜찮음) |
독립표본 T-검정
: 독립된 두 집단
의 평균 차이
검정
표본의 수 | 정규성 증명 방법 |
---|---|
10개 미만 | 비모수적 방법인 만-위트니 검정(Mann-Whitney Test) 적용 |
10개이상~30개미만 | 샤피로-윌크 검정(Shaprio-Wilk Test), 콜모고로프-스미르노프 검정(Kolmogorov-Smirnov Test)로 정규성 증명 |
30개 이상 | 중심극한정리로 정규성 증명 |
var.test(x, y, alternative) |
---|
등분산 검정 또는 F-검정 |
var.test(formula, data, alternative) |
---|
등분산 검정 formula : 데이터 프레임을 var.test 함수에 적용시킬 때 사용 |
t.test(x, y, alternative, var.equal) |
---|
독립표본 T-검정 var.equal : 등분산성 가정 만족 여부(기본 F) |
t.test(formula, data, alternative, var.equal) |
---|
독립표본 T-검정 |
: 두 표본의 분산
에 대한 차이가 유의한지 판별
var.test(x, y, alternative) |
---|
F-검정 |
: 범주형
자료 간의 차이를 보여주는 것으로, 관찰 빈도
와 기대 빈도
가 유의하게 다른지 검정
chisq.test(x, y, p, ...) |
---|
x : 수치형 벡터 또는 행렬 y : 수치형 벡터(x가 행렬이면 무시) p : x와 동일한 크기를 갖는 확률 벡터. 적합도 검정에서 사용 |
적합도 검정
: 표본 집단의 분포
가 주어진 특정 분포
를 따르는지 검정
자유도 = 범주의 수 -1
독립성 검정
: 범주
가 두 개 이상
의 범주로 분할된 경우 사용, 각 범주가 서로 독립적
인지 연관성
이 있는지 검정
자유도 = (범주1 수 -1)x(범주2 수-1)
귀무가설(H0) : 독립적
대립가설(H1) : 연관성o
학년
이라는 범주형 데이터와 선호 과목
이라는 범주형 데이터가 서로 연관성
이 있는지 검정시동질성 검정
: 각각의 독립적인 부모집단
으로부터 정해진 표본의 크기
만큼 추출시, 관측값
들이 정해진 범주 내에서 서로 동질한지
여부 검정
귀무가설(H0) : 동질함