1. 확률밀도함수와 확률분포함수
X∼U(a,b)일 때 확률밀도함수와 확률분포함수는 다음과 같다.
1) 확률밀도함수
f(x)=⎩⎪⎪⎪⎨⎪⎪⎪⎧b−a1,0,if a≤x≤botherwise
2) 확률분포함수
F(x)=⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧0,b−ax−a,0,x<a,if a≤x<b,x≥b
2. 기댓값과 분산
X∼U(a,b)일 때 기댓값과 분산은 다음과 같다.
1) 기댓값
E(X)=∫abxf(x)dx=b−a1∫abx dx=2b+a
2) 분산
E(X2)∴Var(X)=∫abx2f(x)dx=b−a1∫abx2 dx=3b2+ab+a2=12(b−a)3
3. 적률생성함수
X∼U(a,b)일 때 적률생성함수는 다음과 같다.
MX(t)=E(etx)=∫abb−aetxdx=t(b−a)etb−eta
적률생성함수로 활용한 기댓값과 분산은 생략 (과정이 길기 때문에 위 2,3번 풀이로 해결).
4. 추정량
1) 적률 추정량
2) 최대가능도 추정량
U(0,θ)으로부터 랜덤표본 X1,X2,…,Xn을 구했을 때 θ의 최대가능도 추정량은 로그 가능도함수의 미분을 이용하여 다음과 같이 구한다.
우선 가능도함수는
L(θ;x1,x2,…,xn)=i=1∏nf(xi;θ)=⎩⎪⎪⎪⎨⎪⎪⎪⎧θn100≤xi≤θotherwise
이 되며, 모든 θ에 대해 연속이 아니므로 모수 θ에 대하여 미분 가능하지 않다. 이 경우, 미분을 하는 대신 가능도함수의 형태를 살펴보면 쉽게 취대가능도 추정량을 구할 수 있다. 최대가능도 추정량이 표본최댓값 X(n)인 것은 그래프로부터 자명하다. (그래프 참조: p.195)
X(n)의 분포를 구할 때 위의 가능도함수가 아니라 확률밀도함수를 사용한다.
FX(n)(x)∴fX(n)(x)=P(X(n)≤x)=P(X1≤x,X2≤x,…,Xn≤x)={P(X≤x)}n={FX(x)}n=(θx)n=dxd[FX(x)]n=n⋅[FX(x)]n−1dxdFX(x)=n(θx)n−1θ1=θnn(x)n−1
FX(n)(x)=P(X(n)≤x)=P(X1≤x,X2≤x,…,Xn≤x)={P(X≤x)}n={FX(x)}n
fX(n)(x)=dxd[FX(x)]n=n⋅[FX(x)]n−1dxdFX(x)
5. 좋은 추정량 조건
최대가능도 추정량인 경우만 고려하였다.
1) 비편향추정량
U(0,θ)으로부터 랜덤표본 X1,X2,…,Xn을 구했을 때 최대가능도 추정량의 기댓값은 E[X(n)]은 다음과 같다.
E(X(n))=∫0θt⋅θn⋅tn−1dt=(n+1)θnntn+1∣∣∣∣∣0θ=(n+1)nθ
으로 비편향추정량이 아니다. 이 때
T1(X)=(nn+1)X(n)
이라고 하면
E(T1(X))=nn+1⋅n+1n⋅θ=θ
이므로 T1(X)은 θ의 비편향추정량이다.
2) 일치추정량
모수의 함수 g(θ)의 추정량 Tn(X)=T(X1,X2,…,Xn)이 임의의 ϵ>0에 대하여
n→∞limP(∣Tn(X)−g(θ)∣≤ϵ)=1
을 만족하면 추정량 Tn(X)는 일치성이 있다고 한다.
U(0,θ)으로부터 랜덤표본 X1,X2,…,Xn을 구했을 때 최대 가능도 추정량은
X(n)=θnn(x)n−1
이다. 이제 모수 θ의 추정량 X(n)의 일치성에 대해 확인. 임의의 ϵ>0에 대하여
P(∣X(n)−θ∣≤ϵ)=P(θ−ϵ≤X(n)≤θ)=∫θ−ϵθθnn(x)n−1 dx=θn(x)n∣∣∣∣∣θ−ϵθ=1−[θθ−ϵ]n
이 성립한다. 0<ϵ<θ이면 n이 커질 때
[θθ−ϵ]n→0
이므로 P(∣X(n)−θ∣≤ϵ)→1이 되고 ϵ≥θ이면 모든 n에 대해 P(∣X(n)−θ∣≤ϵ)=1이 되므로 표본최댓값 X(n)은 θ의 일치추정량이다.
6. 구간추정
X∼U(0,θ)으로부터 랜덤표본 X1,X2,…,Xn는 적절한 조건 (=미분 가능)을 만족하지 못하므로 신뢰구간을 중심극한정리를 이용하여 다음과 같이 근사적으로 구할 수 없다. 따라서 다음과 같이 구한다.
T=X(n)이라고 하면 그의 확률밀도함수는 fΓ(t;θ)=n(t/θ)n−1(1/θ)0<t<θ이 된다. 이제 임의의 α1, α2 (α1+α2=α)에 대하여
α1∴h1(θ)=∫0h1(θ)n(θt)n−1θ1dt=∫0h1(θ)/θnun−1du(∵u=θt, du=θ1dt)=un∣0h1(θ)/θ=[θh1(θ)]n=θα11/n
α2∴h2(θ)=∫h2(θ)θn(θt)n−1θ1dt=∫h2(θ)/θ1nun−1du(∵u=θt, du=θ1dt)=un∣h2(θ)/θ1=1−[θh2(θ)]n=θ(1−α2)1/n
로부터 θ에 대한 (1−α)×100% 신뢰구간 [X(n)(1−α2)−1/n,X(n)α1−1/n]으로 계산된다. 95% 신뢰수준 (1−α=0.95)에서 일반적으로 α1=α2=2α=0.025로 설정합니다.
따라서 신뢰구간은 최종적으로,
[X(n)⋅0.975−1/n≤θ≤X(n)⋅0.025−1/n]
7. 가설검정
1) 균일 가능도비 검정법
X∼U(0,θ)으로부터 랜덤표본 X1,X2,…,Xn이라 하고 다음 가설 검정을 한다.
H0:θ=θ0vsH1:θ<θ1 (<θ0)
에 대한 가능도비는 다음과 같이 주어진다.
의 가설검정을 생각해 보자. θ1<θ0인 θ0과 θ1에 대하여, 가능도비
LR(θ0,θ1;x1,x2,…,xn)=⎩⎪⎪⎪⎨⎪⎪⎪⎧(1/θ1)n(1/θ0)n=(θ0θ1)n∞, x(n)≤θ1, θ1<x(n)≤θ0
가 된다. 이 경우 가능도비는 T(X1,X2,…,Xn)=X(n)에 대해 비감소함수 (x(n)≤θ1)이므로 X(n)에 대해 단조가능도비의 성질이 있으므로 유의수준 α인 균일최강력 검정법은 그 기각영역이
C={(x1,x2,…,xn):x(n)≤k}
로 주어지며, 상수 k는 P(X(n)≤k∣θ0)=α에 의해 결정된다.
FX(n)(k)∴k=P(X(n)≤k)=P(X1≤k,X2≤k,…,Xn≤k)={P(X≤k)}n={FX(x)}n=(θ0k)n=α=θ0α1/n
2) 일반화 가능도비 검정법
일반화 가능도비를 적절히 변환시킴으로써 필요한 검정통계량의 분포를 구하기 어려움이 존재해 근사 가능도비 검정법을 이용하여 일반화 가능도비 통계량의 근사분포를 구할 수 있다.
X1,X2,…,Xn이 U(0,θ)로부터 얻은 랜덤표본이라고 하고,
H0:θ=θ0vsH1:θ<θ0
의 가설검정을 생각해 보자. 이때 모수공간 Ω는 {θ:θ≤θ0}이므로 X(n)≤θ0을 가정할 수 있고, 일반화 가능도비는
Λ(X1,X2,…,Xn)=(X(n)1)n(θ01)n=[θ0X(n)]n
이 되므로 유의수준이 α인 일반화 가능도비 검정법의 기각영역은 θ0X(n)≤λ∗이다. 단 λ∗는
α=P[(θ0X(n))n≤λ∗∣∣∣∣∣H0]=P[θ0X(n)≤(λ∗)1/n∣∣∣∣∣H0]
를 만족시킨다.
W=θ0X(n),w∗=(λ∗)1/n
라고 정의하면, W의 확률밀도함수가 0<w<1에서 f(w)=nwn−1이므로 (예 3.14)
α=∫0w∗nwn−1dw=(w∗)n
가 된다. 그러므로 가설에 대한 유의수준 α인 일반화 가능도비 검정법의 기각영역은
W=θ0X(n)≤α1/n
으로 주어진다. 이 결과는 가설에 대한 균일최강력 검정법과 같음을 알 수 있다.