균일분포

choyunjeong·2024년 12월 25일

1. 확률밀도함수와 확률분포함수

XU(a,b)X\sim U(a,b)일 때 확률밀도함수와 확률분포함수는 다음과 같다.

1) 확률밀도함수

f(x)={1ba,if axb0,otherwisef(x) = \begin{cases} \dfrac{1}{b-a}, & \text{if } a \leq x \leq b \\[15pt] 0, & \text{otherwise} \end{cases}

\\[20pt]

2) 확률분포함수

F(x)={0,x<a,xaba,if ax<b,0,xbF(x) = \begin{cases} 0, & x<a,\\[5pt] \dfrac{x-a}{b-a}, & \text{if } a \leq x < b, \\[10pt] 0, & x\geq b \end{cases}

\\[30pt]

2. 기댓값과 분산

XU(a,b)X\sim U(a,b)일 때 기댓값과 분산은 다음과 같다.

1) 기댓값

E(X)=abxf(x)dx=1baabx dx=b+a2\begin{aligned} E(X) &=\int_{a}^{b}xf(x)dx \\[15pt] &=\dfrac{1}{b-a}\int_{a}^{b}x\ dx \\[15pt] &=\dfrac{b+a}{2} \end{aligned}

\\[20pt]

2) 분산

E(X2)=abx2f(x)dx=1baabx2 dx=b2+ab+a23Var(X)=(ba)312\begin{aligned} E(X^2) &=\int_{a}^{b}x^2f(x)dx \\[15pt] &=\dfrac{1}{b-a}\int_{a}^{b}x^2\ dx \\[15pt] &=\dfrac{b^2+ab+a^2}{3} \\[20pt] \therefore \text{Var}(X) &=\dfrac{(b-a)^3}{12} \end{aligned}

\\[30pt]

3. 적률생성함수

XU(a,b)X\sim U(a,b)일 때 적률생성함수는 다음과 같다.

MX(t)=E(etx)=abetxbadx=etbetat(ba)\begin{aligned} M_X(t) &=E(e^{tx}) \\[10pt] &=\int_{a}^{b}\dfrac{e^{tx}}{b-a} dx\\[10pt] &=\dfrac{e^{tb}-e^{ta}}{t(b-a)} \end{aligned}

적률생성함수로 활용한 기댓값과 분산은 생략 (과정이 길기 때문에 위 2,3번 풀이로 해결).

\\[30pt]

4. 추정량

1) 적률 추정량

\\[20pt]

2) 최대가능도 추정량

U(0,θ)U(0,\theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 θ\theta의 최대가능도 추정량은 로그 가능도함수의 미분을 이용하여 다음과 같이 구한다.

우선 가능도함수는

L(θ;x1,x2,,xn)=i=1nf(xi;θ)={1θn0xiθ0otherwise\begin{aligned} L(\theta;x_1,x_2,\ldots,x_n)&=\prod_{i=1}^{n}f(x_i;\theta)\\[20pt] &= \begin{cases} \dfrac{1}{\theta^n} & 0\le x_i\le \theta\\[15pt] 0 & \text{otherwise} \end{cases} \end{aligned}

이 되며, 모든 θ\theta에 대해 연속이 아니므로 모수 θ\theta에 대하여 미분 가능하지 않다. 이 경우, 미분을 하는 대신 가능도함수의 형태를 살펴보면 쉽게 취대가능도 추정량을 구할 수 있다. 최대가능도 추정량이 표본최댓값 X(n)X_{(n)}인 것은 그래프로부터 자명하다. (그래프 참조: p.195)
X(n)X_{(n)}의 분포를 구할 때 위의 가능도함수가 아니라 확률밀도함수를 사용한다.

FX(n)(x)=P(X(n)x)=P(X1x,X2x,,Xnx)={P(Xx)}n={FX(x)}n=(xθ)nfX(n)(x)=ddx[FX(x)]n=n[FX(x)]n1ddxFX(x)=n(xθ)n11θ=n(x)n1θn\begin{aligned} F_{X_{(n)}}(x) &= P(X_{(n)}\le x) \\[10pt] &=P(X_1\le x,X_2\le x,\ldots,X_n\le x) \\[10pt] &=\left\{P(X\le x)\right\}^n \\[10pt] &=\left\{F_X(x)\right\}^n \\[10pt] &=\left(\dfrac{x}{\theta}\right)^n \\[20pt] \therefore f_{X_{(n)}}(x) &= \dfrac{d}{dx}\left[F_X(x)\right]^n \\[15pt] &= n\cdot\left[F_X(x)\right]^{n-1}\dfrac{d}{dx}F_X(x) \\[15pt] &=n\left(\dfrac{x}{\theta}\right)^{n-1}\dfrac{1}{\theta} \\[15pt] &=\dfrac{n(x)^{n-1}}{\theta^n} \end{aligned}

\\[30pt]


FX(n)(x)=P(X(n)x)=P(X1x,X2x,,Xnx)={P(Xx)}n={FX(x)}n\begin{aligned} F_{X_{(n)}}(x) &= P(X_{(n)}\le x) \\[10pt] &=P(X_1\le x,X_2\le x,\ldots,X_n\le x) \\[10pt] &=\left\{P(X\le x)\right\}^n \\[10pt] &=\left\{F_X(x)\right\}^n \end{aligned}
fX(n)(x)=ddx[FX(x)]n=n[FX(x)]n1ddxFX(x)\begin{aligned} f_{X_{(n)}}(x) &= \dfrac{d}{dx}\left[F_X(x)\right]^n \\[15pt] &= n\cdot\left[F_X(x)\right]^{n-1}\dfrac{d}{dx}F_X(x) \\[15pt] \end{aligned}

\\[30pt]

5. 좋은 추정량 조건

최대가능도 추정량인 경우만 고려하였다.

1) 비편향추정량

U(0,θ)U(0,\theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 최대가능도 추정량의 기댓값은 E[X(n)]E[X_{(n)}]은 다음과 같다.

E(X(n))=0θtntn1θdt=ntn+1(n+1)θn0θ=n(n+1)θ\begin{aligned} E(X_{(n)}) &=\int_{0}^{\theta}t\cdot\dfrac{n\cdot t^{n-1}}{\theta} dt \\[10pt] &=\left.\dfrac{nt^{n+1}}{(n+1)\theta^n}\right|_{0}^{\theta} \\[10pt] &=\dfrac{n}{(n+1)}\theta \end{aligned}

으로 비편향추정량이 아니다. 이 때

T1(X)=(n+1n)X(n)T_1(X)=\left(\dfrac{n+1}{n}\right)X_{(n)}

이라고 하면

E(T1(X))=n+1nnn+1θ=θE(T_1(X))=\dfrac{n+1}{n}\cdot\dfrac{n}{n+1}\cdot\theta=\theta

이므로 T1(X)T_1(X)θ\theta의 비편향추정량이다.

\\[20pt]

2) 일치추정량

모수의 함수 g(θ)g(\theta)의 추정량 Tn(X)=T(X1,X2,,Xn)T_n(X)=T(X_1,X_2,\ldots,X_n)이 임의의 ϵ>0\epsilon>0에 대하여

limnP(Tn(X)g(θ)ϵ)=1\lim_{n\rightarrow\infty}P(|T_n(X)-g(\theta)|\le\epsilon)=1

을 만족하면 추정량 Tn(X)T_n(X)는 일치성이 있다고 한다.

U(0,θ)U(0,\theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n을 구했을 때 최대 가능도 추정량은

X(n)=n(x)n1θnX_{(n)}=\dfrac{n(x)^{n-1}}{\theta^n}

이다. 이제 모수 θ\theta의 추정량 X(n)X_{(n)}의 일치성에 대해 확인. 임의의 ϵ>0\epsilon>0에 대하여

P(X(n)θϵ)=P(θϵX(n)θ)=θϵθn(x)n1θn dx=(x)nθnθϵθ=1[θϵθ]n\begin{aligned} P(|X_{(n)}-\theta|\le\epsilon) &=P(\theta-\epsilon\le X_{(n)}\le\theta) \\[10pt] &=\int_{\theta-\epsilon}^{\theta}\dfrac{n(x)^{n-1}}{\theta^n}\ dx \\[15pt] &=\left.\dfrac{(x)^{n}}{\theta^n} \right|_{\theta-\epsilon}^{\theta} \\[15pt] &=1-\left[\dfrac{\theta-\epsilon}{\theta}\right]^n \end{aligned}

이 성립한다. 0<ϵ<θ0<\epsilon<\theta이면 nn이 커질 때

[θϵθ]n0\left[\dfrac{\theta-\epsilon}{\theta}\right]^n\rightarrow0

이므로 P(X(n)θϵ)1P(|X_{(n)}-\theta|\le\epsilon)\rightarrow1이 되고 ϵθ\epsilon\ge\theta이면 모든 nn에 대해 P(X(n)θϵ)=1P(|X_{(n)}-\theta|\le\epsilon)=1이 되므로 표본최댓값 X(n)X_{(n)}θ\theta의 일치추정량이다.

\\[30pt]

6. 구간추정

XU(0,θ)X\sim U(0, \theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n는 적절한 조건 (=미분 가능)을 만족하지 못하므로 신뢰구간을 중심극한정리를 이용하여 다음과 같이 근사적으로 구할 수 없다. 따라서 다음과 같이 구한다.

T=X(n)T=X_{(n)}이라고 하면 그의 확률밀도함수는 fΓ(t;θ)=n(t/θ)n1(1/θ)0<t<θf_{\Gamma}(t;\theta)=n(t/\theta)^{n-1}(1/\theta)\quad 0<t<\theta이 된다. 이제 임의의 α1, α2 (α1+α2=α)\alpha_1,\ \alpha_2\ (\alpha_1+\alpha_2=\alpha)에 대하여

α1=0h1(θ)n(tθ)n11θdt=0h1(θ)/θnun1du(u=tθ, du=1θdt)=un0h1(θ)/θ=[h1(θ)θ]nh1(θ)=θα11/n\begin{aligned} \alpha_1&=\int_{0}^{h_1(\theta)}n\left(\dfrac{t}{\theta}\right)^{n-1}\dfrac{1}{\theta}dt \\[15pt] &= \int_{0}^{h_1(\theta)/\theta}nu^{n-1}du\quad (\because u=\dfrac{t}{\theta},\ du=\dfrac{1}{\theta}dt)\\[15pt] &= \left.u^n\right|_{0}^{h_1(\theta)/\theta} \\[15pt] &= \left[\dfrac{h_1(\theta)}{\theta}\right]^n \\[25pt] \therefore h_1(\theta)&=\theta\alpha_1^{1/n} \end{aligned}

\\[25pt]

α2=h2(θ)θn(tθ)n11θdt=h2(θ)/θ1nun1du(u=tθ, du=1θdt)=unh2(θ)/θ1=1[h2(θ)θ]nh2(θ)=θ(1α2)1/n\begin{aligned} \alpha_2&=\int_{h_2(\theta)}^{\theta}n\left(\dfrac{t}{\theta}\right)^{n-1}\dfrac{1}{\theta}dt \\[15pt] &= \int_{h_2(\theta)/\theta}^{1}nu^{n-1}du\quad (\because u=\dfrac{t}{\theta},\ du=\dfrac{1}{\theta}dt)\\[15pt] &= \left.u^n\right|_{h_2(\theta)/\theta}^{1} \\[15pt] &= 1-\left[\dfrac{h_2(\theta)}{\theta}\right]^n \\[25pt] \therefore h_2(\theta)&=\theta(1-\alpha_2)^{1/n} \end{aligned}

로부터 θ\theta에 대한 (1α)×100%(1-\alpha)\times100\% 신뢰구간 [X(n)(1α2)1/n,X(n)α11/n][X_{(n)}(1-\alpha_2)^{-1/n}, X_{(n)}\alpha_1^{-1/n}]으로 계산된다. 95% 신뢰수준 (1α=0.95)(1-\alpha = 0.95)에서 일반적으로 α1=α2=α2=0.025\alpha_1 = \alpha_2 = \frac{\alpha}{2} = 0.025로 설정합니다.

따라서 신뢰구간은 최종적으로,

[X(n)0.9751/nθX(n)0.0251/n]\left[ X_{(n)} \cdot 0.975^{-1/n}\le\theta\le X_{(n)} \cdot 0.025^{-1/n} \right]

\\[30pt]

7. 가설검정

1) 균일 가능도비 검정법

XU(0,θ)X\sim U(0,\theta)으로부터 랜덤표본 X1,X2,,XnX_1,X_2,\ldots,X_n이라 하고 다음 가설 검정을 한다.

H0:θ=θ0vsH1:θ<θ1 (<θ0)H_0:\theta=\theta_0\quad\text{vs}\quad H_1:\theta<\theta_1\ (<\theta_0)

에 대한 가능도비는 다음과 같이 주어진다.

의 가설검정을 생각해 보자. θ1<θ0\theta_1<\theta_0θ0\theta_0θ1\theta_1에 대하여, 가능도비

LR(θ0,θ1;x1,x2,,xn)={(1/θ0)n(1/θ1)n=(θ1θ0)n, x(n)θ1, θ1<x(n)θ0LR(\theta_0,\theta_1;x_1,x_2,\ldots,x_n) =\begin{cases} \dfrac{(1/\theta_0)^n}{(1/\theta_1)^n}=\left(\dfrac{\theta_1}{\theta_0}\right)^n & ,\ x_{(n)}\le\theta_1\\[15pt] \infty &,\ \theta_1<x_{(n)}\le\theta_0 \end{cases}

가 된다. 이 경우 가능도비는 T(X1,X2,,Xn)=X(n)T(X_1,X_2,\ldots,X_n)=X_{(n)}에 대해 비감소함수 (x(n)θ1)(x_{(n)}\le\theta_1)이므로 X(n)X_{(n)}에 대해 단조가능도비의 성질이 있으므로 유의수준 α\alpha인 균일최강력 검정법은 그 기각영역이

C={(x1,x2,,xn):x(n)k}C=\{(x_1,x_2,\ldots,x_n):x_{(n)}\le k\}

로 주어지며, 상수 kkP(X(n)kθ0)=αP(X_{(n)}\le k|\theta_0)=\alpha에 의해 결정된다.

FX(n)(k)=P(X(n)k)=P(X1k,X2k,,Xnk)={P(Xk)}n={FX(x)}n=(kθ0)n=αk=θ0α1/n\begin{aligned} F_{X_{(n)}}(k) &= P(X_{(n)}\le k) \\[10pt] &=P(X_1\le k,X_2\le k,\ldots,X_n\le k) \\[10pt] &=\left\{P(X\le k)\right\}^n \\[10pt] &=\left\{F_X(x)\right\}^n \\[10pt] &=\left(\dfrac{k}{\theta_0}\right)^n = \alpha \\[20pt] \therefore k &= \theta_0 \alpha^{1/n} \end{aligned}

\\[20pt]

2) 일반화 가능도비 검정법

일반화 가능도비를 적절히 변환시킴으로써 필요한 검정통계량의 분포를 구하기 어려움이 존재해 근사 가능도비 검정법을 이용하여 일반화 가능도비 통계량의 근사분포를 구할 수 있다.

X1,X2,,XnX_1,X_2,\ldots,X_nU(0,θ)U(0,\theta)로부터 얻은 랜덤표본이라고 하고,

H0:θ=θ0vsH1:θ<θ0H_0:\theta=\theta_0\quad\text{vs}\quad H_1:\theta<\theta_0

의 가설검정을 생각해 보자. 이때 모수공간 Ω\Omega{θ:θθ0}\{\theta:\theta\le\theta_0\}이므로 X(n)θ0X_{(n)}\le\theta_0을 가정할 수 있고, 일반화 가능도비는

Λ(X1,X2,,Xn)=(1θ0)n(1X(n))n=[X(n)θ0]n\Lambda(X_1,X_2,\ldots,X_n)=\dfrac{\left(\dfrac{1}{\theta_0}\right)^n}{\left(\dfrac{1}{X_{(n)}}\right)^n}=\left[\dfrac{X_{(n)}}{\theta_0}\right]^n \\[15pt]

이 되므로 유의수준이 α\alpha인 일반화 가능도비 검정법의 기각영역은 X(n)θ0λ\dfrac{X_{(n)}}{\theta_0}\le\lambda^*이다. 단 λ\lambda^*

α=P[(X(n)θ0)nλH0]=P[X(n)θ0(λ)1/nH0]\begin{aligned} \alpha&=P\left[\left.\left(\dfrac{X_{(n)}}{\theta_0}\right)^n\le\lambda^*\right|H_0\right] \\[15pt] &=P\left[\left.\dfrac{X_{(n)}}{\theta_0}\le\left(\lambda^*\right)^{1/n}\right|H_0\right] \\[15pt] \end{aligned}

를 만족시킨다.

W=X(n)θ0,w=(λ)1/nW=\dfrac{X_{(n)}}{\theta_0},\quad w^*=(\lambda^*)^{1/n}

라고 정의하면, WW의 확률밀도함수가 0<w<10<w<1에서 f(w)=nwn1f(w)=nw^{n-1}이므로 (예 3.14)

α=0wnwn1dw=(w)n\begin{aligned} \alpha&=\int_{0}^{w^*}nw^{n-1}dw\\[15pt] &=(w^*)^n \end{aligned}

가 된다. 그러므로 가설에 대한 유의수준 α\alpha인 일반화 가능도비 검정법의 기각영역은

W=X(n)θ0α1/nW=\dfrac{X_{(n)}}{\theta_0}\le \alpha^{1/n}

으로 주어진다. 이 결과는 가설에 대한 균일최강력 검정법과 같음을 알 수 있다.

0개의 댓글