그룹이 3개 이상일 때 t-test를 여러번 하면 될 것 같으나 안됨
-> 1종 오류에 빠짐, 따라서 새로운 방법을 배워야 함
1-(1-a)^c = ac
0.05 3(그룹) = 0.15 ! 5%가 아니라 15%가 되버림
그래서 새로운 통계 방법을 배워야함.
One-way 는 독립변수가 하나라는 뜻
ANOVA는 Analysis of Variance의 약자
분산분석
무엇으로부터 독립?
주로 인과관계를 연구/조사하므로 이때 이 인과관계에서 종속적인 위치는 결과보다는 원인이다.
논리적 관계에서의 독립
결과를 설명하기에 설명 변수라고도 함
그렇다고 임의로 숫자를 넣으면 안됨.
어디에 종속될까?
주로 인과관계를 연구/조사하므로 이때 이 인과관계에서 종속적인 위치는 원인보다는 결과이다.
결과가 되는 변수 = 결과 변수 = 반응 변수
기본적으로는 독립변수와 동일하나, 연구/조사의 주된 관심사가 되는 변수가 아닌 경우
통제변수를 한개도 감안하지 않을 경우 : Model Misspecification 발생
종속변수 : 연속형 변수만 가능
독립변수 : 이산형/범주형(Discrete/Categorical) 변수만 가능
뮤 = 평균 (누구에게나 똑같이 적용되는 값=평균 값은 관심이 없다/)
우리는 분산을 알고 싶다
타우j = 독립변수, j는 그룹
Y = 종속변수, 좌측에 옴, 연속변수
i의 규칙 = j가 겹치면 다음 i는 +1
j 는 그룹 i는 id
e = 타우j로 설명되지 않는 오차
= random 한 오차
= 무작위로 발생해야함
1) 변수가 독립성
2) 정규성
3) 등분산성