실험계획법 때도 나오고 여기저기 나오는 이름인데, 맨날 공부하고 까먹게 되는 것 같다. 약간 왈드, 스코어 감성이다.
H0:Cβ=0 가설검정에서 F 통계량이 다음과 같이 나온다. (s는 MSE임)
F=s2(Cβ^)⊤[C(X⊤X)−1C⊤]−1(Cβ^)/q
근데, 가설 하나에 대해서 표현한다면 어떻게 하면 될까?
F=s2(a⊤β^)⊤[a⊤(X⊤X)−1a]−1(a⊤β^)/1=s2[a⊤(X⊤X)−1a](a⊤β^)2for some a
쉐페 다중 가설검정의 아이디어는 "F 중에 제일 큰거 기준으로 기각역잡으면 한번에 가설검정할 수 있지 않을까"였다. 그래서 아래와 같은 수식이 나온다.
amaxs2[a⊤(X⊤X)−1a](a⊤β^)2를 컨트롤 하자!
몫의 미분법을 열심히 적용해보면 식이 나온다. 일단 Q를 정의하자.
Q=s2[a⊤(X⊤X)−1a](a⊤β^)2
dadQ=s21[(a⊤(X⊤X)−1a)22(a⊤β^)(a⊤(X⊤X)−1a)β^−2(a⊤β^)2(X⊤X)−1a]=0⇒(a⊤(X⊤X)−1a)β^−(a⊤β^)(X⊤X)−1a=0⇒a=(a⊤β^)(a⊤(X⊤X)−1a)(X⊤X)β^=ξ(X⊤X)β^
그래서 마지막 식 저 식에 넣으면 a가 사라지면서, 최댓값이 매우 이쁘게 나온다.
s2ξ2(β^⊤X⊤Xβ^)ξ2(β^⊤X⊤Xβ^)2=s2β^X⊤Xβ^
그리고 위의 식은 아래의 H0:β0:p=0의 F검정 통계량이랑 똑같다.
s2β^X⊤Y=SSESSR(Full)