6.2 독립변수가 둘인 경우
하나의 종속변수 (y)와 두 개의 독립변수 (x1, x2) 사이에 다음과 같이 표현될 수 있다.
yi=β0+β1x1i+β2x2i+ϵi,i=1,…,n
일반적으로 오차항 ϵi에 대한 가정은
ϵi∼N(0,σ2)Cov(ϵi, ϵj)=0,i=j
이고 βi의 추정값을 bi라고 할 때 E(yi)의 추정값은
y^i=b0+b1x1i+b2x2i
이며, bi들의 최소제곱법에 의하여 구하려면 다음의 오차제곱합
S=i=1∑nϵ2=i=1∑n(yi−β0−β1x1i−β2x2i)2
을 최소로 하는 βi의 값을 구하면 된다. 위 식을 βi에 대하여 각각 편미분하여 0으로 놓으면 정규방정식을 얻을 수 있으며 연립방정식을 풀면 최소제곱법에 의한 βi의 추정값인 bi를 구할 수 있을 것이다 (본문 p.176-177 참고). 만약, 독립변수의 수가 n개의 경우 n+1개의 연립방정식을 다루어야하는 복잡함이 있으므로 중회귀분석에서는 거의 모든 경우에 행렬을 사용하여 표현 방법을 간소화한다.
6.3 행렬의 사용
독립변수가 하나인 경우 관계식을 벡터로 표현하면
yi=β0+β1xi+ϵi=(1,xi)(β1β0)+ϵi
행렬을 사용하면
⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡y1y2y3⋮yn⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡111⋮1x1x2x3⋮xn⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤(β0β1)+⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡ϵ1ϵ2ϵ3⋮ϵn⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
이라 쓸 수 있고, 이를 간략하게
y=Xβ+ϵ
이라고 표기한다. 최소제곱법에 의하여 최소화시키려는 양은 오차제곱합으로
i=1∑nϵi2=ϵi′ϵi=(y−Xβ)′(y−Xβ)=y′y−2β′X′y+β′X′Xβ
가 되며, 이를 β에 대하여 미분하여 0으로 놓고 이를 만족시키는 β의 값을 b로 하여 다음의 정규방정식을 얻는다.
여기서 b′=(b0, b1)으로 각각 β0, β1의 추정값이다.
만약 X′X의 역행렬이 존재한다면 b′를 다음과 같이 표기할 수 있다.
b=(X′X)−1X′y
행렬로 표기한 것이 연립방적을 통한 해와 같은 지 확인하려면 본문 p.179-180 참고.
그러므로 중회귀모형은 행렬을 사용하여 다음과 같이 표현이 가능하다.
y=Xβ+ϵ,ϵ∼N(0,Iσ2)E(y)=XβVar(y)=Var(ϵ)=Iσ2
오차 ϵi에 대한 가정은
-
다변량 정규분포
-
ϵi∼N(0,σ2),Cov(ϵi, ϵj)=0,i=j
-
특별한 조건이 붙지 않는 한 행렬 X의 계수 (rank)는
r(X)=k+1,n>k
기댓값과 분산
(1) β
이제 β=(β0,β1,…,βn)의 추정량 b의 기댓값과 분산에 대해 알아보자.
E(b)=E[(X′X)−1X′y]=(X′X)−1X′E[y]=(X′X)−1X′Xβ=β
따라서 b는 β의 불편추정량이다.
- 분산
Var(b)=Var[(X′X)−1X′y]=(X′X)−1X′⋅Var[y]⋅X(X′X)−1=(X′X)−1X′⋅Iσ2⋅X(X′X)−1=σ2(X′X)−1
그런데 Var(b)는 분산과 공분산을 나타내는 행렬
Var(b)=Var⎣⎢⎢⎢⎢⎡b0b1⋮bp⎦⎥⎥⎥⎥⎤=⎣⎢⎢⎢⎢⎢⎢⎡Var(b0)Cov(b0,b1)Var(b1)Cov(b0,b2)Cov(b1,b2)Var(b1)………Cov(b0,bp)Cov(b1,bp)Cov(b1,bp)⋮Cov(b1,bp)⎦⎥⎥⎥⎥⎥⎥⎤
이므로
Var(bi)=ciiσ2, i=0,1,2,…,pCov(bi,bj)=cijσ2, i=j,i=0,1,2,…,p
- 공분산
Cov(b0, b1)=Cov(yˉ−b1xˉ, b1)=Cov(yˉ, b1)−xˉCov(b1, b1)(∵linear)=Cov(yˉ, b1)−xˉCov(b1, b1)=−xˉCov(b1, b1)(Cov(yˉ, b1)=0,∵indep)=−xˉVar(b1)=S(xx)−xˉσ2
(2) y^
y^의 기댓값과 분산은
E(y^)=Xβ
Var(y^)=Var(Xb)=XVar(b)X′=X(X′X)−1σ2X′=σ2X(X′X)−1X′
6.4 분산분석
회귀직선의 유의성 검정을 하기 위해서 가설을 다음과 같이 정의했다.
H0:β1=β2=…=βp=0vsH1:not H0
회귀직선의 유의성 검정을 할 때 F−검정을 하는데 그 값은 위에 구한 MSE, MSR의 비율이다. 만약 F0>F(p,n−p−1;α)이면 귀무가설을 기각하여 회귀선이 유의하다고 할 수 있다.
| 요인 | 제곱합 | 자유도 | 평균제곱 | F0 | 유의확률 |
|---|
| 회귀 | SSR | p | MSR=pSSR | MSEMSR | P(F≥F0) |
| 잔차 | SSE | n−p−1 | MSE=n−p−1SSE | | |
총변동 (SST) = 회귀방정식에 의하여 설명되어지는 변동 (SSR) + 설명되어지지 않는 잔차에 의한 변동 (SSE)
(1) SST
SST=∑(yi−yˉ)2=∑yi2−n(yˉ)2=y′y−n(yˉ)2
SST=y′y−n(yˉ)2=y′y−y′(nJ)y=y′(I−nJ)y
이며 이 때
(I−nJ)2=[σ21(I−nJ)][Iσ2]=[I−nJ]
이므로 (I−nJ)=A는 멱등행렬(??)이고 차수 rank(A)=n−1이다. 따라서 정리 5.3을 이용하여 SSE의 분포는 다음과 같이 구할 수 있다.
σ2SST∼χ2(n−1, β′X′[I−nJ]Xβ/2σ2)
- 정리 5.3
만약 y∼N(E(y),Var(y))이면
y′Ay∼χ2(rank(A),2E(y)′AE(y))
(2) SSE
SSE=∑(yi−y^)2=(y−y^)′(y−y^)=(y−Xb)′(y−Xb)(∵y^=Xb)=y′y−2b′X′y+b′X′Xb=y′y−2y′X(X′X)−1X′y+y′X(X′X)−1X′X(X′X)−1X′y(∵b=(X′X)−1X′y)=y′y−2y′X(X′X)−1X′y+y′X(X′X)−1X′y=y′y−y′X(X′X)−1X′y=y′[I−X(X′X)−1X′]y=y′y−b′X′y
-
E(SSE)
E(SSE)=E{y′[I−X(X′X)−1X′]y}=E(y′Ay)(∵I−X(X′X)−1X′=A)=tr{A⋅[Var(y)]}+[E(y)]′A[E(y)]=tr(AIσ2)+(Xβ)′A(Xβ)=σ2tr(A)+β′X′AXβ=(n−p−1)σ2
- 참고
tr(A)X′AX=tr[I−X(X′X)−1X′]=tr(I)−tr[X(X′X)−1X′]=tr(In)−tr(Ip+1)=n−(p+1)=n−p−1=X′[I−X(X′X)−1X′]X=0(∵ [I−X(X′X)−1X′]X=0)
-
E(MSE)
E(MSE)=n−k−1E(SSE)=σ2
SSE=y′[I−X(X′X)−1X′]y에서 [I−X(X′X)−1X′]는 멱등행렬이므로 계수는 n−p−1이 된다. 또한
E(y)′AE(y)=β′X′[I−X(X′X)−1X′]Xβ=0
이므로 따라서 정리 5.3을 이용하여 SSE의 분포는 다음과 같이 구할 수 있다.
σ2SSE∼χ2(n−p−1)
(3) SSR
-
SSR
SSRSSR=SST−SSE=[y′y−n(yˉ)2]−[y′y−b′X′y]=b′X′y−n(yˉ)2=y′X(X′X)−1X′y−n(yˉ)2or=∑(y^−yˉ)2=∑y^2−n(yˉ)2=y^′y^−n(yˉ)2=b′X′Xb−n(yˉ)2(∵y^=Xb)=y′X(X′X)−1X′X(X′X)−1X′y−n(yˉ)2(∵b=(X′X)−1X′y)=y′X(X′X)−1X′y−n(yˉ)2=b′X′y−n(yˉ)2
-
E(SSR)
E(SSR)=E[y′X(X′X)−1X′y−n(yˉ)2]=E[y′X(X′X)−1X′y−y′(nJ)y]=E{y′[X(X′X)−1X′−(nJ)]y}=E(y′Ay)(∵ X(X′X)−1X′−(nJ)=A)=tr{A⋅[Var(y)]}+[E(y)]′A[E(y)]=tr(AIσ2)+(Xβ)′A(Xβ)=σ2tr(A)+β′X′AXβ=pσ2+β′X′[X(X′X)−1X′−nJ]Xβ=pσ2+β′X′[X(X′X)−1X′]Xβ−β′X′(nJ)Xβ=pσ2+β′X′Xβ−β′X′(nJ)Xβ=pσ2+β′X′(I−nJ)Xβ
- 참고
tr(A)=tr[X(X′X)−1X′−nJ]=tr[X(X′X)−1X′]−tr(nJ)=tr[(X′X)−1X′X]−tr(nJ)=tr(Ip)−tr(nJ)=(p+1)−1=p
-
E(MSR)
E(MSR)=pE(SSR)=σ2+pβ′X′(I−nJ)Xβ
SSR=y′X(X′X)−1X′y−n(yˉ)2=y′X(X′X)−1X′y−y′(nJ)y=y′[X(X′X)−1X′−nJ]y
이며 이 때 X(X′X)−1X′1=1 (연습문제 1.12 참조)이므로
X(X′X)−1X′J=J,JX(X′X)−1X′=J,JJ=nJ
가 또한 성립한다.
[X(X′X)−1X′−nJ][X(X′X)−1X′−nJ]=X(X′X)−1X′X(X′X)−1X′−JX(X′X)−1X′/n−X(X′X)−1X′J/n+JJ/n2=X(X′X)−1X′−nJ
이므로 X(X′X)−1X′−nJ=A는 멱등행렬이다. 이 행렬의 계수는 (1+p)−1=p이다. 따라서 정리 5.3을 이용하여 SSE의 분포는 다음과 같이 구할 수 있다.
σ2SSR∼χ2(rank(A), 2σ2E(y)′⋅A⋅E(y))∼χ2(p, β′X′[I−nJ]Xβ/2σ2)
∵E(y)′⋅A⋅E(y)=β′X′⋅[X(X′X)−1X′−nJ]⋅Xβ=β′X′X(X′X)−1X′Xβ−β′X′nJXβ=β′X′Xβ−β′X′nJXβ=β′X′[I−nJ]Xβ
(4) 가설 설정과 검정통계량
1. 가설 설정
회귀직선의 유의성 검정을 하기 위해서 가설을
H0:β1=β2=…=βp=0vsH1:not H0
위와 같이 정의해도 되는지 확인하기 위하여 MSR과 MSE의 기댓값의 비를 보면 된다.
E[MSE]E[MSR]=1+kσ21β′X′(I−nJ)Xβ
인데 X′(I−nJ)X가 양반정치행렬이므로 모든 β에 대해
β′X′(I−nJ)Xβ≥0
이며, 등호가 성립하는 경우는 β0에 관계없이 다음과 같은 관계가 되어야 한다.
β1=β2=…=βp=0
즉, 적어도 하나가 0이 아니면 양의값이 된다. 따라서 분산분석표의 F−검정은 위와 같은 가설을 가지고 있다고 보아도 좋을 것이다.
2. 검정통계량
귀무가설이 유의수준 α에서 옳은 것인가 아닌가의 판단할 때 F−검정을 해도 되는지 알아본다. 우선 두 개의 y의 이차형식인 σ2SSR과 σ2SSE가 서로 독립적으로 분포되어 있는가를 알아봐야 한다. 정리 5.6을 이용하기 위하여
y∼N(Xβ, Iσ2)y′Ay=y′[σ2X(X′X)−1X′−J/n]yy′By=y′[σ2I−X(X′X)−1X′]y
라 놓으면 필요충분조건
AVB=[σ2X(X′X)−1X′−J/n][Iσ2][σ2I−X(X′X)−1X′]=0
이 만족된다.
- 정리 5.6
y∼N(E(y),V)일 때 두 이차형식, y′Ay와 y′By가 독립적으로 분포하기 위한 필요충분조건은 AVB=0(orBVA=0)
따라서 SSR과 SSE는 서로 독립적으로 분포하고 있다.
이제 y∼N(E(y),Iσ2)일 때 비중심 F−분포 이론에서 논의된 바와 같이 (p.159-160)
σ2SSR∼χ2(p,λ),σ2SSE∼χ2(n−p−1)
이며, SSR과 SSE가 서로 독립이므로, 검정통계량
F0=MSEMSR=(σ2SSE)/(n−p−1)(σ2SSR)/p
는 비중심 F−분포 F′(p,n−p−1,λ)를 하며, 비중심모수는
λ=21E(y)′AE(y)=β′X′(I−nJ)Xβ/2σ2
이다. 그런데, 중회귀모형
yi=β0+i=1∑nβixij+ϵj
의 분산분석표의 F−검정은 그 귀무가설을 독립변수들과 종소변수의 간의 관계를 설명하는데 중회귀모형이 의미가 없다라고 말할 수 있으며 이는 앞에 설명한대로로
H0=β1=β2=⋯=βp=0
라고 표현할 수 있다. 만약 귀무가설이 성립하면
F0=MSEMSR∼F(p,n−p−1)
과 같은 분포를 하여, 귀무가설이 유의수준 α에서 옳은 것인가 아닌가의 판단을 F−분포표로부터 기각치 F(p,n−p−1;α)를 찾아서 F0의 값과 비교하여 결론을 낼 수 있을 것이다. 만약 F0>F(p,n−p−1;α)이면 귀무가설을 기각하여 회귀선이 유의하다고 할 수 있다.
7.4 가설검정
회귀식이 다음과 같을 때
yi=β0+β1x1i+β2x2i+β3x3i+β4x4i+ϵi,ϵi∼N(0,σ2), i=1,2,…,n
다음의 가설에 대하여 General Linear Hypothesis를 수행하여라.
H0:β1=β2,β3=β4vsnot H0
FMRM: yi=β0+β1x1i+β2x2i+β3x3i+β4x4i+ϵi: yi=β0+β1(x1i+x2i)+β3(x3i+x4i)+ϵi=γ0+γ1z1i+γ2z2i+ϵi
H0:Tβ=0이라 설정할 때 β1=β2,β3=β4이므로 T는 다음과 같다.
T=(0010−10010−1)
T의 계수를 검정통계량 분자의 자유도로 설정한다. 여기서는 r=2이다. 이 때 검정통계량 값은 귀무가설 하에서
F0=SSEFM/(n−p−1)(SSEFM−SSEFM)/(r)∼F(r, n−p−1)
이므로 이 문제에서
F0>F(2,n−4−1;α)
이면 귀무가설을 기각하고 아니면 귀무가설을 채택한다. 각 모형의 자유도는 SSEFM=n−p−1, SSERM=n−p−1+r 이다.
[참고문헌]