[빅분기] 검정

당당·2023년 11월 10일
0

빅분기

목록 보기
7/7
post-thumbnail
post-custom-banner

📔설명

R을 이용해 검정을 해보자


🍿Z-검정

: 모집단의 분산을 알고 있는 경우, 모집단의 평균표본평균과 차이가 있는지 검정

pnorm(q, mean, sd, ...)
stats패키지의 pnorm함수는 누적분포함수 값 계산 함수
q : 확률변수 값
mean : 평균(기본 0)
sd : 표준편차(기본 1)


🥠T-검정

: 독립변수가 범주형이고, 종속변수가 수치형일 경우 두 집단 평균 비교, 모분산모를 때

단일표본 T-검정
: 한 집단의 평균이 모집단의 평균과 같은지 검정

shapiro.test(data)
단일표본 T-검정을 수행하기 전 표본에 대한 정규성 검정
H0 : 정규분포 따름
H1 : 정규분포를 따르지 않음

정규성 가정 시

t.test(x, alternative, mu)
x : 표본으로부터 관측한 값
alternative : 검정 방향(two.sided, less, greater)
mu : 검정 시 기준이 되는 값(μ_0)

T검정 결과 변수설명
statistict-검정 통계값(t)
parameter자유도(df)
p.valuep값
conf.int지정된 대체 가설에 적합한 평균 신뢰구간
estimate추정된 평균
stderr평균 표준 오차

정규성 만족 X시

wilcox.test(x, alternative, mu)
x : 표본으로부터 관측한 값
alternative : 검정 방향(two.sided, less, greater)
mu : 검정 시 기준이 되는 값(μ_0)

윌콕슨 검정 결과 변수설명
statisticwilcox 검정 통계값(V)
parameter검정 통계량의 정확한 분포를 위한 파라미터
p.valuep값
alternative대안 가설 설명 문자열


쌍체표본 T-검정
: 한 집단에서 처치를 받기 전의 차이를 알아보는 검정

t.test(x, y, alternative, paired, m)
x, y : 표본으로부터 관측한 값
alternative : 검정 방향(two.sided, less, greater)
paired : 쌍체표본 T검정을 수행할지 여부(기본 F)
m : 검정 시 기준이 되는 값(기본 0) (쌍체표본 T검정은 모평균 차이가 0인지 검정하기 때문에 입력 안해도 괜찮음)


독립표본 T-검정
: 독립된 두 집단평균 차이 검정

표본의 수정규성 증명 방법
10개 미만비모수적 방법인 만-위트니 검정(Mann-Whitney Test) 적용
10개이상~30개미만샤피로-윌크 검정(Shaprio-Wilk Test),
콜모고로프-스미르노프 검정(Kolmogorov-Smirnov Test)로 정규성 증명
30개 이상중심극한정리로 정규성 증명

var.test(x, y, alternative)
등분산 검정 또는 F-검정

var.test(formula, data, alternative)
등분산 검정
formula : 데이터 프레임을 var.test 함수에 적용시킬 때 사용

t.test(x, y, alternative, var.equal)
독립표본 T-검정
var.equal : 등분산성 가정 만족 여부(기본 F)

t.test(formula, data, alternative, var.equal)
독립표본 T-검정


🥮F-검정

: 두 표본의 분산에 대한 차이가 유의한지 판별

var.test(x, y, alternative)
F-검정


🍩카이제곱 검정

: 범주형 자료 간의 차이를 보여주는 것으로, 관찰 빈도기대 빈도가 유의하게 다른지 검정

chisq.test(x, y, p, ...)
x : 수치형 벡터 또는 행렬
y : 수치형 벡터(x가 행렬이면 무시)
p : x와 동일한 크기를 갖는 확률 벡터. 적합도 검정에서 사용

적합도 검정
: 표본 집단의 분포가 주어진 특정 분포를 따르는지 검정

  • 자유도 = 범주의 수 -1

독립성 검정
: 범주두 개 이상의 범주로 분할된 경우 사용, 각 범주가 서로 독립적인지 연관성이 있는지 검정

  • 자유도 = (범주1 수 -1)x(범주2 수-1)
  • 귀무가설(H0) : 독립적
  • 대립가설(H1) : 연관성o
  • ex) 학년이라는 범주형 데이터와 선호 과목이라는 범주형 데이터가 서로 연관성이 있는지 검정시

동질성 검정
: 각각의 독립적인 부모집단으로부터 정해진 표본의 크기만큼 추출시, 관측값들이 정해진 범주 내에서 서로 동질한지 여부 검정

  • 귀무가설(H0) : 동질함
  • ==독립성 검정 계산 방식
profile
MySQL DBA 신입
post-custom-banner

0개의 댓글