다중회귀분석

choyunjeong·2025년 1월 2일

6.2 독립변수가 둘인 경우

하나의 종속변수 (y)(y)와 두 개의 독립변수 (x1, x2)(x_1,\ x_2) 사이에 다음과 같이 표현될 수 있다.

yi=β0+β1x1i+β2x2i+ϵi,i=1,,ny_i=\beta_0 + \beta_1x_{1i} + \beta_2x_{2i} + \epsilon_i,\quad i=1,\ldots,n

일반적으로 오차항 ϵi\epsilon_i에 대한 가정은

ϵiN(0,σ2)Cov(ϵi, ϵj)=0,ij\epsilon_i\sim N(0,\sigma^2) \\[10pt] Cov(\epsilon_i,\ \epsilon_j) = 0,\quad i\neq j

이고 βi\beta_i의 추정값을 bib_i라고 할 때 E(yiE(y_i)의 추정값은

y^i=b0+b1x1i+b2x2i\hat{y}_i=b_0 + b_1x_{1i} + b_2x_{2i}

이며, bib_i들의 최소제곱법에 의하여 구하려면 다음의 오차제곱합

S=i=1nϵ2=i=1n(yiβ0β1x1iβ2x2i)2S=\sum_{i=1}^{n}\epsilon^2=\sum_{i=1}^{n}(y_i - \beta_0 - \beta_1x_{1i} - \beta_2x_{2i})^2

을 최소로 하는 βi\beta_i의 값을 구하면 된다. 위 식을 βi\beta_i에 대하여 각각 편미분하여 0으로 놓으면 정규방정식을 얻을 수 있으며 연립방정식을 풀면 최소제곱법에 의한 βi\beta_i의 추정값인 bib_i를 구할 수 있을 것이다 (본문 p.176-177 참고). 만약, 독립변수의 수가 nn개의 경우 n+1n+1개의 연립방정식을 다루어야하는 복잡함이 있으므로 중회귀분석에서는 거의 모든 경우에 행렬을 사용하여 표현 방법을 간소화한다.

\\[60pt]

6.3 행렬의 사용

독립변수가 하나인 경우 관계식을 벡터로 표현하면

yi=β0+β1xi+ϵi=(1,xi)(β0β1)+ϵiy_i=\beta_0 + \beta_1x_i + \epsilon_i = (1,x_i) \binom{\beta_0}{\beta_1} + \epsilon_i

행렬을 사용하면

[y1y2y3yn]=[1x11x21x31xn](β0β1)+[ϵ1ϵ2ϵ3ϵn]\begin{bmatrix} y_1 \\[5pt] y_2 \\[5pt] y_3 \\[5pt] \vdots \\[5pt] y_n \end{bmatrix} =\begin{bmatrix} 1 & x_1 \\[5pt] 1 & x_2 \\[5pt] 1 & x_3 \\[5pt] \vdots & \vdots \\[5pt] 1 & x_n \end{bmatrix} \begin{pmatrix} \beta_0 \\[5pt] \beta_1 \end{pmatrix} + \begin{bmatrix} \epsilon_1 \\[5pt] \epsilon_2 \\[5pt] \epsilon_3 \\[5pt] \vdots \\[5pt] \epsilon_n \end{bmatrix}

이라 쓸 수 있고, 이를 간략하게

y=Xβ+ϵy=X\beta + \epsilon

이라고 표기한다. 최소제곱법에 의하여 최소화시키려는 양은 오차제곱합으로

i=1nϵi2=ϵiϵi=(yXβ)(yXβ)=yy2βXy+βXXβ\sum_{i=1}^{n}\epsilon_i^2 = \epsilon_i'\epsilon_i = (y-X\beta)'(y-X\beta)=y'y-2\beta'X'y+\beta'X'X\beta

가 되며, 이를 β\beta에 대하여 미분하여 00으로 놓고 이를 만족시키는 β\beta의 값을 bb로 하여 다음의 정규방정식을 얻는다.

XXb=XyX'Xb=X'y

여기서 b=(b0, b1)b'=(b_0,\ b_1)으로 각각 β0, β1\beta_0,\ \beta_1의 추정값이다.

만약 XXX'X의 역행렬이 존재한다면 bb'를 다음과 같이 표기할 수 있다.

b=(XX)1Xyb=(X'X)^{-1}X'y

행렬로 표기한 것이 연립방적을 통한 해와 같은 지 확인하려면 본문 p.179-180 참고.

그러므로 중회귀모형은 행렬을 사용하여 다음과 같이 표현이 가능하다.

y=Xβ+ϵ,ϵN(0,Iσ2)E(y)=XβVar(y)=Var(ϵ)=Iσ2y = X\beta + \epsilon,\quad \epsilon\sim N(0,I\sigma^2) \\[10pt] E(y)=X\beta \\[10pt] \text{Var}(y)=\text{Var}(\epsilon)=I\sigma^2

오차 ϵi\epsilon_i에 대한 가정은

  1. 다변량 정규분포

  2. ϵiN(0,σ2),Cov(ϵi, ϵj)=0,ij\epsilon_i\sim N(0,\sigma^2),\quad Cov(\epsilon_i,\ \epsilon_j) = 0,\quad i\neq j

  3. 특별한 조건이 붙지 않는 한 행렬 XX의 계수 (rank)는

    r(X)=k+1,n>kr(X)=k+1,\quad n>k

\\[60pt]

기댓값과 분산

(1) β\beta

이제 β=(β0,β1,,βn)\beta=(\beta_0,\beta_1,\ldots,\beta_n)의 추정량 bb기댓값과 분산에 대해 알아보자.

  • 기댓값
E(b)=E[(XX)1Xy]=(XX)1XE[y]=(XX)1XXβ=β\begin{aligned} E(b)&=E[(X'X)^{-1}X'y] \\[10pt] &=(X'X)^{-1}X'E[y] \\[10pt] &=(X'X)^{-1}X'X\beta \\[10pt] &=\beta \end{aligned}

따라서 bbβ\beta의 불편추정량이다.

  • 분산
    Var(b)=Var[(XX)1Xy]=(XX)1XVar[y]X(XX)1=(XX)1XIσ2X(XX)1=σ2(XX)1\begin{aligned} \text{Var}(b)&=\text{Var}[(X'X)^{-1}X'y] \\[10pt] &=(X'X)^{-1}X'\cdot\text{Var}[y]\cdot X(X'X)^{-1} \\[15pt] &=(X'X)^{-1}X'\cdot I\sigma^2\cdot X(X'X)^{-1} \\[15pt] &=\sigma^2(X'X)^{-1} \end{aligned}

그런데 Var(b)\text{Var}(b)는 분산과 공분산을 나타내는 행렬

Var(b)=Var[b0b1bp]=[Var(b0)Cov(b0,b1)Cov(b0,b2)Cov(b0,bp)Var(b1)Cov(b1,b2)Cov(b1,bp)Var(b1)Cov(b1,bp)Cov(b1,bp)]\text{Var}(b) =\text{Var} \begin{bmatrix} b_0 \\ b_1 \\ \vdots \\ b_p \end{bmatrix} = \begin{bmatrix} \text{Var}(b_0) & Cov(b_0,b_1) & Cov(b_0,b_2) & \dots & Cov(b_0,b_p) \\ & \text{Var}(b_1) & Cov(b_1,b_2) & \dots & Cov(b_1,b_p) \\ & & \text{Var}(b_1) & \dots & Cov(b_1,b_p) \\ & & & & \vdots \\ & & & & Cov(b_1,b_p) \\ \end{bmatrix}

이므로

Var(bi)=ciiσ2, i=0,1,2,,pCov(bi,bj)=cijσ2, ij,i=0,1,2,,p\text{Var}(b_i)=c_{ii}\sigma^2,\ i=0,1,2,\ldots,p \\[10pt] Cov(b_i,b_j)=c_{ij}\sigma^2,\ i\neq j,\quad i=0,1,2,\ldots,p
  • 공분산
    Cov(b0, b1)=Cov(yˉb1xˉ, b1)=Cov(yˉ, b1)xˉCov(b1, b1)(linear)=Cov(yˉ, b1)xˉCov(b1, b1)=xˉCov(b1, b1)(Cov(yˉ, b1)=0,indep)=xˉVar(b1)=xˉσ2S(xx)\begin{aligned} Cov(b_0,\ b_1) &= Cov(\bar{y}-b_1\bar{x},\ b_1) \\[10pt] &= Cov(\bar{y},\ b_1) - \bar{x}Cov(b_1,\ b_1) \quad (\because \text{linear}) \\[10pt] &= Cov(\bar{y},\ b_1) - \bar{x}Cov(b_1,\ b_1) \\[10pt] &= -\bar{x}Cov(b_1,\ b_1) \quad ( Cov(\bar{y},\ b_1)=0,\quad \because\text{indep}) \\[10pt] &= -\bar{x}\text{Var}(b_1) \\[10pt] &= \dfrac{-\bar{x}\sigma^2}{S_{(xx)}} \\[10pt] \end{aligned}

\\[40pt]

(2) y^\hat{y}

y^\hat{y}기댓값과 분산

  • 기댓값
E(y^)=Xβ\begin{aligned} E(\hat{y}) &= X\beta \end{aligned}
  • 분산
Var(y^)=Var(Xb)=XVar(b)X=X(XX)1σ2X=σ2X(XX)1X\begin{aligned} \text{Var}(\hat{y}) &=\text{Var}(Xb) \\[10pt] &=X\text{Var}(b)X'\\[10pt] &=X(X'X)^{-1}\sigma^2X'\\[10pt] &=\sigma^2X(X'X)^{-1}X' \end{aligned}

\\[60pt]

6.4 분산분석

회귀직선의 유의성 검정을 하기 위해서 가설을 다음과 같이 정의했다.

H0:β1=β2==βp=0vsH1:not H0H_0:\beta_1=\beta_2=\ldots=\beta_p=0\quad\text{vs}\quad H_1: \text{not } H_0

회귀직선의 유의성 검정을 할 때 FF-검정을 하는데 그 값은 위에 구한 MSE, MSRMSE,\ MSR의 비율이다. 만약 F0>F(p,np1;α)F_0>F(p,n-p-1;\alpha)이면 귀무가설을 기각하여 회귀선이 유의하다고 할 수 있다.

  • 분산분석표
요인제곱합자유도평균제곱F0F_0유의확률
회귀SSRSSRppMSR=SSRpMSR=\dfrac{SSR}{p}MSRMSE\dfrac{MSR}{MSE}P(FF0)P(F\ge F_0)
잔차SSESSEnp1n-p-1MSE=SSEnp1MSE=\dfrac{SSE}{n-p-1}

총변동 (SST)(SST) = 회귀방정식에 의하여 설명되어지는 변동 (SSR)(SSR) + 설명되어지지 않는 잔차에 의한 변동 (SSE)(SSE)

(1) SSTSST

  • SSTSST
SST=(yiyˉ)2=yi2n(yˉ)2=yyn(yˉ)2SST = \sum(y_i-\bar{y})^2 = \sum y_i^2-n(\bar{y})^2 = y'y-n(\bar{y})^2
  • SSTSST 확률분포
SST=yyn(yˉ)2=yyy(Jn)y=y(IJn)y\begin{aligned} SST &= y'y-n(\bar{y})^2 \\[10pt] &= y'y - y'\left(\dfrac{J}{n}\right)y \\[10pt] &= y'\left(I-\dfrac{J}{n}\right)y \end{aligned}

이며 이 때

(IJn)2=[1σ2(IJn)][Iσ2]=[IJn]\left(I-\dfrac{J}{n}\right)^2=\left[\dfrac{1}{\sigma^2}\left(I-\dfrac{J}{n}\right)\right]\left[I\sigma^2\right]=\left[I-\dfrac{J}{n}\right]

이므로 (IJn)=A\left(I-\dfrac{J}{n}\right)=A는 멱등행렬(??)이고 차수 rank(A)=n1rank(A)=n-1이다. 따라서 정리 5.3을 이용하여 SSESSE의 분포는 다음과 같이 구할 수 있다.

SSTσ2χ2(n1, βX[IJn]Xβ/2σ2)\dfrac{SST}{\sigma^2} \sim \chi^2\left(n-1,\ \beta'X'\left[I-\dfrac{J}{n}\right]X\beta/2\sigma^2\right)
  • 정리 5.3
    만약 yN(E(y),Var(y))y\sim N(E(y),\text{Var}(y))이면
yAyχ2(rank(A),E(y)AE(y)2)y'Ay\sim \chi^2 \left(rank(A),\dfrac{E(y)'AE(y)}{2}\right)

\\[40pt]

(2) SSESSE

  • SSESSE
SSE=(yiy^)2=(yy^)(yy^)=(yXb)(yXb)(y^=Xb)=yy2bXy+bXXb=yy2yX(XX)1Xy+yX(XX)1XX(XX)1Xy(b=(XX)1Xy)=yy2yX(XX)1Xy+yX(XX)1Xy=yyyX(XX)1Xy=y[IX(XX)1X]y=yybXy\begin{aligned} SSE &= \sum(y_i-\hat{y})^2 \\[10pt] &= (y-\hat{y})'(y-\hat{y}) \\[10pt] &= (y-Xb)'(y-Xb)\quad (\because \hat{y}=Xb) \\[10pt] &= y'y-2b'X'y+b'X'Xb \\[10pt] &= y'y-2y'X(X'X)^{-1}X'y+y'X(X'X)^{-1}X'X(X'X)^{-1}X'y \\[10pt] &\quad (\because b = (X'X)^{-1}X'y) \\[10pt] &= y'y-2y'X(X'X)^{-1}X'y+y'X(X'X)^{-1}X'y \\[10pt] &= y'y - y'X(X'X)^{-1}X'y \\[10pt] &= y'[I- X(X'X)^{-1}X']y \\[10pt] &= y'y-b'X'y\\[20pt] \end{aligned}
  • E(SSE)E(SSE)

    E(SSE)=E{y[IX(XX)1X]y}=E(yAy)(IX(XX)1X=A)=tr{A[Var(y)]}+[E(y)]A[E(y)]=tr(AIσ2)+(Xβ)A(Xβ)=σ2tr(A)+βXAXβ=(np1)σ2\begin{aligned} E(SSE) &= E\left\{y'[I-X(X'X)^{-1}X']y\right\} \\[10pt] &= E(y'Ay)\quad (\because I-X(X'X)^{-1}X'=A) \\[10pt] &= \text{tr}\left\{A\cdot[\text{Var}(y)]\right\} +[E(y)]'A[E(y)] \\[10pt] &= \text{tr}\left(AI\sigma^2\right) +(X\beta)'A(X\beta) \\[10pt] &= \sigma^2\text{tr}(A)+\beta'X'A X\beta \\[10pt] &=(n-p-1)\sigma^2 \end{aligned}
    • 참고
      tr(A)=tr[IX(XX)1X]=tr(I)tr[X(XX)1X]=tr(In)tr(Ip+1)=n(p+1)=np1XAX=X[IX(XX)1X]X=0( [IX(XX)1X]X=0)\begin{aligned} \text{tr}(A) &= \text{tr}[I-X(X'X)^{-1}X'] \\[10pt] &= \text{tr}(I) - \text{tr}[X(X'X)^{-1}X'] \\[10pt] &= \text{tr}(I_n) - \text{tr}(I_{p+1})\\[10pt] &= n - (p+1) \\[10pt] &= n-p-1 \\[20pt] X'A X&=X'[I-X(X'X)^{-1}X']X \\[10pt] &= 0\quad (\because\ [I-X(X'X)^{-1}X']X=0) \end{aligned}
  • E(MSE)E(MSE)

E(MSE)=E(SSE)nk1=σ2E(MSE)=\dfrac{E(SSE)}{n-k-1}=\sigma^2
  • SSESSE 확률분포

SSE=y[IX(XX)1X]ySSE=y'[I-X(X'X)^{-1}X']y에서 [IX(XX)1X][I-X(X'X)^{-1}X']는 멱등행렬이므로 계수는 np1n-p-1이 된다. 또한

E(y)AE(y)=βX[IX(XX)1X]Xβ=0E(y)'AE(y)=\beta'X'[I-X(X'X)^{-1}X']X\beta=0

이므로 따라서 정리 5.3을 이용하여 SSESSE의 분포는 다음과 같이 구할 수 있다.

SSEσ2χ2(np1)\dfrac{SSE}{\sigma^2}\sim \chi^2\left(n-p-1\right)

\\[40pt]

(3) SSRSSR

  • SSRSSR

    SSR=SSTSSE=[yyn(yˉ)2][yybXy]=bXyn(yˉ)2=yX(XX)1Xyn(yˉ)2orSSR=(y^yˉ)2=y^2n(yˉ)2=y^y^n(yˉ)2=bXXbn(yˉ)2(y^=Xb)=yX(XX)1XX(XX)1Xyn(yˉ)2(b=(XX)1Xy)=yX(XX)1Xyn(yˉ)2=bXyn(yˉ)2\begin{aligned} SSR &= SST - SSE \\[10pt] &= [y'y-n(\bar{y})^2]-[y'y-b'X'y] \\[10pt] &= b'X'y - n(\bar{y})^2 \\[10pt] &= y'X(X'X)^{-1}X'y - n(\bar{y})^2 \\[10pt] &\text{or} \\[10pt] SSR &= \sum(\hat{y}-\bar{y})^2 \\[10pt] &= \sum\hat{y}^2-n(\bar{y})^2 \\[10pt] &= \hat{y}'\hat{y}-n(\bar{y})^2 \\[10pt] &= b'X'Xb-n(\bar{y})^2\quad (\because \hat{y}=Xb) \\[10pt] &= y'X(X'X)^{-1}X'X(X'X)^{-1}X'y-n(\bar{y})^2\quad (\because b = (X'X)^{-1}X'y) \\[10pt] &= y'X(X'X)^{-1}X'y-n(\bar{y})^2 \\[10pt] &= b'X'y-n(\bar{y})^2 \\[10pt] \end{aligned}
  • E(SSR)E(SSR)

    E(SSR)=E[yX(XX)1Xyn(yˉ)2]=E[yX(XX)1Xyy(Jn)y]=E{y[X(XX)1X(Jn)]y}=E(yAy)( X(XX)1X(Jn)=A)=tr{A[Var(y)]}+[E(y)]A[E(y)]=tr(AIσ2)+(Xβ)A(Xβ)=σ2tr(A)+βXAXβ=pσ2+βX[X(XX)1XJn]Xβ=pσ2+βX[X(XX)1X]XββX(Jn)Xβ=pσ2+βXXββX(Jn)Xβ=pσ2+βX(IJn)Xβ\begin{aligned} E(SSR) &= E\left[y'X(X'X)^{-1}X'y-n(\bar{y})^2\right] \\[10pt] &= E\left[y'X(X'X)^{-1}X'y-y'\left(\dfrac{J}{n}\right)y\right] \\[10pt] &= E\left\{y'\left[X(X'X)^{-1}X'-\left(\dfrac{J}{n}\right)\right]y\right\} \\[10pt] &= E\left(y'Ay\right)\quad \left(\because\ X(X'X)^{-1}X'-\left(\dfrac{J}{n}\right)=A\right) \\[10pt] &= \text{tr}\left\{A\cdot[\text{Var}(y)]\right\} +[E(y)]'A[E(y)] \\[10pt] &= \text{tr}\left(AI\sigma^2\right) +(X\beta)'A(X\beta) \\[10pt] &= \sigma^2\text{tr}\left(A\right) +\beta'X'AX\beta \\[10pt] &=p\sigma^2 + \beta'X'\left[X(X'X)^{-1}X'-\dfrac{J}{n}\right]X\beta \\[10pt] &=p\sigma^2 + \beta'X'\left[X(X'X)^{-1}X'\right]X\beta - \beta'X'\left(\dfrac{J}{n}\right)X\beta \\[10pt] &=p\sigma^2 + \beta'X'X\beta - \beta'X'\left(\dfrac{J}{n}\right)X\beta \\[10pt] &=p\sigma^2 + \beta'X'\left(I-\dfrac{J}{n}\right)X\beta \end{aligned}

    - 참고

    tr(A)=tr[X(XX)1XJn]=tr[X(XX)1X]tr(Jn)=tr[(XX)1XX]tr(Jn)=tr(Ip)tr(Jn)=(p+1)1=p\begin{aligned} \text{tr}(A) &= \text{tr}\left[X(X'X)^{-1}X'-\dfrac{J}{n}\right] \\[10pt] &= \text{tr}[X(X'X)^{-1}X'] - \text{tr}\left(\dfrac{J}{n}\right) \\[10pt] &= \text{tr}[(X'X)^{-1}X'X] - \text{tr}\left(\dfrac{J}{n}\right) \\[10pt] &= \text{tr}(I_p) - \text{tr}\left(\dfrac{J}{n}\right) \\[10pt] &= (p+1)-1 \\[10pt] &= p \end{aligned}
  • E(MSR)E(MSR)

E(MSR)=E(SSR)p=σ2+βX(IJn)XβpE(MSR)=\dfrac{E(SSR)}{p}=\sigma^2 + \dfrac{\beta'X'\left(I-\dfrac{J}{n}\right)X\beta}{p}
  • SSRSSR 확률분포
SSR=yX(XX)1Xyn(yˉ)2=yX(XX)1Xyy(Jn)y=y[X(XX)1XJn]y\begin{aligned} SSR &= y'X(X'X)^{-1}X'y-n(\bar{y})^2 \\[10pt] &= y'X(X'X)^{-1}X'y-y'\left(\dfrac{J}{n}\right)y \\[10pt] & = y'\left[X(X'X)^{-1}X'-\dfrac{J}{n}\right]y \end{aligned}

이며 이 때 X(XX)1X1=1X(X'X)^{-1}X'\bold{1}=\bold{1} (연습문제 1.12 참조)이므로

X(XX)1XJ=J,JX(XX)1X=J,JJ=nJX(X'X)^{-1}X'J=J,\quad JX(X'X)^{-1}X'=J,\quad JJ=nJ

가 또한 성립한다.

[X(XX)1XJn][X(XX)1XJn]=X(XX)1XX(XX)1XJX(XX)1X/nX(XX)1XJ/n+JJ/n2=X(XX)1XJn\begin{aligned} &\left[X(X'X)^{-1}X'-\dfrac{J}{n}\right]\left[X(X'X)^{-1}X'-\dfrac{J}{n}\right] \\[15pt] &=X(X'X)^{-1}X'X(X'X)^{-1}X'-JX(X'X)^{-1}X'/n-X(X'X)^{-1}X'J/n+JJ/n^2 \\[10pt] &=X(X'X)^{-1}X'-\dfrac{J}{n} \end{aligned}

이므로 X(XX)1XJn=AX(X'X)^{-1}X'-\dfrac{J}{n}=A는 멱등행렬이다. 이 행렬의 계수는 (1+p)1=p(1+p)-1=p이다. 따라서 정리 5.3을 이용하여 SSESSE의 분포는 다음과 같이 구할 수 있다.

SSRσ2χ2(rank(A), E(y)AE(y)2σ2)χ2(p, βX[IJn]Xβ/2σ2)\begin{aligned} \dfrac{SSR}{\sigma^2} &\sim \chi^2\left(rank(A),\ \dfrac{E(y)'\cdot A\cdot E(y)}{2\sigma^2}\right) \\[15pt] &\sim \chi^2\left(p,\ \beta'X'\left[I-\dfrac{J}{n}\right]X\beta/2\sigma^2\right) \\[20pt] \end{aligned}
E(y)AE(y)=βX[X(XX)1XJn]Xβ=βXX(XX)1XXββXJnXβ=βXXββXJnXβ=βX[IJn]Xβ\begin{aligned} \because E(y)'\cdot A\cdot E(y) &= \beta'X'\cdot [X(X'X)^{-1}X'-\dfrac{J}{n}]\cdot X\beta \\ &=\beta'X'X(X'X)^{-1}X'X\beta-\beta'X'\dfrac{J}{n}X\beta \\ &=\beta'X'X\beta-\beta'X'\dfrac{J}{n}X\beta \\ &= \beta'X'\left[I-\dfrac{J}{n}\right]X\beta \end{aligned}

\\[40pt]

(4) 가설 설정과 검정통계량

1. 가설 설정

회귀직선의 유의성 검정을 하기 위해서 가설을

H0:β1=β2==βp=0vsH1:not H0H_0:\beta_1=\beta_2=\ldots=\beta_p=0\quad\text{vs}\quad H_1: \text{not } H_0

위와 같이 정의해도 되는지 확인하기 위하여 MSRMSRMSEMSE의 기댓값의 비를 보면 된다.

E[MSR]E[MSE]=1+1kσ2βX(IJn)Xβ\dfrac{E[MSR]}{E[MSE]}=1+\dfrac{1}{k\sigma^2}\beta'X'(I-\dfrac{J}{n})X\beta

인데 X(IJn)XX'(I-\dfrac{J}{n})X가 양반정치행렬이므로 모든 β\beta에 대해

βX(IJn)Xβ0\beta'X'(I-\dfrac{J}{n})X\beta\ge 0

이며, 등호가 성립하는 경우는 β0\beta_0에 관계없이 다음과 같은 관계가 되어야 한다.

β1=β2==βp=0\beta_1=\beta_2=\ldots=\beta_p=0

즉, 적어도 하나가 0이 아니면 양의값이 된다. 따라서 분산분석표의 FF-검정은 위와 같은 가설을 가지고 있다고 보아도 좋을 것이다.

\\[30pt]

2. 검정통계량

귀무가설이 유의수준 α\alpha에서 옳은 것인가 아닌가의 판단할 때 FF-검정을 해도 되는지 알아본다. 우선 두 개의 yy의 이차형식인 SSRσ2\dfrac{SSR}{\sigma^2}SSEσ2\dfrac{SSE}{\sigma^2}가 서로 독립적으로 분포되어 있는가를 알아봐야 한다. 정리 5.6을 이용하기 위하여

yN(Xβ, Iσ2)yAy=y[X(XX)1XJ/nσ2]yyBy=y[IX(XX)1Xσ2]yy\sim N(X\beta,\ I\sigma^2) \\[15pt] y'Ay=y'\left[\dfrac{X(X'X)^{-1}X'-J/n}{\sigma^2}\right]y \\[15pt] y'By=y'\left[\dfrac{I-X(X'X)^{-1}X'}{\sigma^2}\right]y

라 놓으면 필요충분조건

AVB=[X(XX)1XJ/nσ2][Iσ2][IX(XX)1Xσ2]=0AVB=\left[\dfrac{X(X'X)^{-1}X'-J/n}{\sigma^2}\right][I\sigma^2]\left[\dfrac{I-X(X'X)^{-1}X'}{\sigma^2}\right]=\bold{0}

이 만족된다.

  • 정리 5.6
    yN(E(y),V)y\sim N(E(y),V)일 때 두 이차형식, yAyy'AyyByy'By가 독립적으로 분포하기 위한 필요충분조건은
    AVB=0(orBVA=0)AVB=\bold{0}\quad(\text{or}\quad BVA=\bold{0})

따라서 SSRSSRSSESSE는 서로 독립적으로 분포하고 있다.

이제 yN(E(y),Iσ2)y\sim N(E(y),I\sigma^2)일 때 비중심 FF-분포 이론에서 논의된 바와 같이 (p.159-160)

SSRσ2χ2(p,λ),SSEσ2χ2(np1)\dfrac{SSR}{\sigma^2}\sim \chi^2(p,\lambda),\quad \dfrac{SSE}{\sigma^2}\sim \chi^2(n-p-1)

이며, SSRSSRSSESSE가 서로 독립이므로, 검정통계량

F0=MSRMSE=(SSRσ2)/p(SSEσ2)/(np1)F_0=\dfrac{MSR}{MSE}=\dfrac{\left(\dfrac{SSR}{\sigma^2}\right)/p}{\left(\dfrac{SSE}{\sigma^2}\right)/(n-p-1)}

는 비중심 FF-분포 F(p,np1,λ)F'(p,n-p-1,\lambda)를 하며, 비중심모수는

λ=12E(y)AE(y)=βX(IJn)Xβ/2σ2\lambda=\dfrac{1}{2}E(y)'AE(y)=\beta'X'\left(I-\dfrac{J}{n}\right)X\beta/2\sigma^2

이다. 그런데, 중회귀모형

yi=β0+i=1nβixij+ϵjy_i=\beta_0+\sum_{i=1}^{n}\beta_ix_{ij}+\epsilon_j

의 분산분석표의 FF-검정은 그 귀무가설을 독립변수들과 종소변수의 간의 관계를 설명하는데 중회귀모형이 의미가 없다라고 말할 수 있으며 이는 앞에 설명한대로로

H0=β1=β2==βp=0H_0=\beta_1=\beta_2=\cdots=\beta_p=0

라고 표현할 수 있다. 만약 귀무가설이 성립하면

F0=MSRMSEF(p,np1)F_0=\dfrac{MSR}{MSE}\sim F(p,n-p-1)

과 같은 분포를 하여, 귀무가설이 유의수준 α\alpha에서 옳은 것인가 아닌가의 판단을 FF-분포표로부터 기각치 F(p,np1;α)F(p,n-p-1;\alpha)를 찾아서 F0F_0의 값과 비교하여 결론을 낼 수 있을 것이다. 만약 F0>F(p,np1;α)F_0>F(p,n-p-1;\alpha)이면 귀무가설을 기각하여 회귀선이 유의하다고 할 수 있다.

\\[60pt]

7.4 가설검정

회귀식이 다음과 같을 때

yi=β0+β1x1i+β2x2i+β3x3i+β4x4i+ϵi,ϵiN(0,σ2), i=1,2,,ny_i=\beta_0 + \beta_1x_{1i} + \beta_2x_{2i} + \beta_3x_{3i} + \beta_4x_{4i} + \epsilon_i, \quad \epsilon_i\sim _N(0,\sigma^2),\ i=1,2,\ldots,n

다음의 가설에 대하여 General Linear Hypothesis를 수행하여라.

\\[20pt]

H0:β1=β2,β3=β4vsnot H0H_0:\beta_1=\beta_2,\quad\beta_3=\beta_4\quad \text{vs}\quad \text{not } H_0
FM: yi=β0+β1x1i+β2x2i+β3x3i+β4x4i+ϵiRM: yi=β0+β1(x1i+x2i)+β3(x3i+x4i)+ϵi=γ0+γ1z1i+γ2z2i+ϵi\begin{aligned} FM&:\ y_i = \beta_0 + \beta_1x_{1i} + \beta_2x_{2i} + \beta_3x_{3i} + \beta_4x_{4i} + \epsilon_i \\[10pt] RM&:\ y_i = \beta_0 + \beta_1(x_{1i} + x_{2i}) + \beta_3(x_{3i} + x_{4i}) + \epsilon_i \\[10pt] &\quad\quad = \gamma_0 + \gamma_1z_{1i} + \gamma_2z_{2i} + \epsilon_i \\[10pt] \end{aligned}

H0:Tβ=0H_0:T\beta=0이라 설정할 때 β1=β2,β3=β4\beta_1=\beta_2,\quad\beta_3=\beta_4이므로 TT는 다음과 같다.

T=(0110000011)T=\begin{pmatrix} 0&1&-1&0&0 \\ 0&0&0&1&-1 \end{pmatrix}

TT의 계수를 검정통계량 분자의 자유도로 설정한다. 여기서는 r=2r=2이다. 이 때 검정통계량 값은 귀무가설 하에서

F0=(SSEFMSSEFM)/(r)SSEFM/(np1)F(r, np1)F_0=\dfrac{(\text{SSE}_{FM}-\text{SSE}_{FM})/(r)}{\text{SSE}_{FM}/(n-p-1)}\sim F(r,\ n-p-1)

이므로 이 문제에서

F0>F(2,n41;α)F_0> F(2,n-4-1;\alpha)

이면 귀무가설을 기각하고 아니면 귀무가설을 채택한다. 각 모형의 자유도는 SSEFM=np1, SSERM=np1+r\text{SSE}_{FM} = n - p -1,\ \text{SSE}_{RM} = n - p -1 +r 이다.


[참고문헌]

  • 회귀분석 제 3판 - 박성현

0개의 댓글