분산분석(ANOVA) in r

9566·2021년 6월 14일
1

데이터 분석

목록 보기
10/10
post-thumbnail

분산분석(anova)


x1의 범주가 y 평균값의 차이가 있는가?

  • ex) 귀무가설 : x1(2개의 범주 : 포워드, 미드필더)에 대해 y(연봉)의 평균은 모두 같다.

X별 Y 평균의 차이가 있는지 통계적으로 검증

summary(aov(Y~X1, data)) #1원배치 

summary(aov(Y~X1+X2+X1:X2, data)) #2원배치 X1:X2=상호작용효과
# p-value <0.05 이면 귀무가설 기각
# 적어도 어느 한 포지션은 통계적으로 유의한 차이가 있다. 
# 연봉 평균값에 차이가 있다.

TukeyHSD(aov(Y~X1, data)) # 사후검정 p adj > 0.05면 유의한 차이가 있다. 

X에 따른 Y의 차이가 있는지 통계적으로 검증

var.test(Y~X1, data, alternative = "two.sided") 
#p-value > 0.05이면 귀무가설을 기각하지 않음 = 등분산 가정을 만족

t.test(Y~X1, data, alternative = "two.sided", var.equal = TRUE)
#p-value > 0.05이기에 X1과 X1이 아닌 데이터 간 Y에는 통계적으로 유의한 차이가 없다.
profile
안녕하세요 안녕안녕하세요 안녕하세요오오오~~

0개의 댓글