확률변수 X가 어떤 분포를 따르는지도 모를 때, 분포의 모수에 의존하지 않는 비모수 추정을 통해 확률 함수를 탐색할 수 있다.
PMF 추정
서포트가 유한할 때
X가 확률 함수 p(x)를 가지는 이산 확률 변수라고 하자. X1,X2,...,Xn은 X의 랜덤 표본이고, RX={a1,a2,...,am}는 유한하다.
이런 상황에서 p(aj)=P(X=aj)의 직관적인 추정은 표본 크기 대비 각 원소의 빈도로 생각해볼 수 있다. 표본에서 각 aj의 빈도를 알아내고, 비율을 알아내기 위해 다음과 같이 추정량을 정의하자.
Ij(Xi)={1 (Xi=aj)0 (Xi=aj)p^(aj)=n1i=1∑nIj(Xi)
p^(aj)는 표본에서 aj의 출현 비율을 의미하며, {p^(a1),p^(a2),...,p^(am)}은 p(aj)=P(X=aj)의 확률 함수 전체를 추정하는 역할을 한다.
Ij(Xi)는 성공 확률이 p^(aj)인 베르누이 시행을 따르는 확률 변수로 생각할 수 있다. 서포트가 {0,1}이며, 1이 나올 확률은 p^(aj)과 동일하기 때문이다.
이 성질을 이용하면 n1∑i=1nIj(Xi)는 p(aj)의 불편추정량임을 확인할 수 있다.
E[p^(aj)]=n1i=1∑nE[Ij(Xi)]=n1i=1∑np(aj)=p(aj)
서포트가 무한할 때
이산 확률 변수 X의 서포트가 {a1,a2,...}로 원소가 유한하지 않은 상황에서는 다음과 같이 확률 함수를 추정할 수 있다.
X의 서포트를 다음과 같이 묶어보자.
{a1},{a2},...,{am},am+1~={am+1,am+2,...}
a1 ~ am는 서포트의 원소 그대로지만, am+1~은 am+1 이상의 모든 값을 묶은 집합이 된다.
이렇게 나머지를 하나의 원소로 묶으면 서포트가 유한한 것처럼 다룰 수 있게 된다.
따라서 {p^(a1),p^(a1),...,p^(am+1~)}을 확률 함수의 추정량으로 사용할 수 있다.
보통은 p^(am+1~)가 p^(am)의 2배 정도가 되도록 m을 정한다.
PDF 추정
확률 변수 X가 연속인 경우에는 확률 변수가 가질 수 있는 값이 이산적이지 않기 때문에, 히스토그램을 이용한 추정을 바로 적용할 수 없다. 따라서 구간을 임의적으로 나누고 각 구간에 대한 추정량을 찾아야 히스토그램 추정을 적용할 수 있다.
X의 확률 함수를 f(t)라고 하자.
P(x−h<X<x+h)=∫x−hx+hf(t)dt
확률 밀도 함수와 구간의 확률의 관계에 따라 위 항등식이 성립한다.
∫x−hx+hf(t)dt는 CDF와 PDF의 관계에 따라 F(x+h)−F(x−h)와 동일하다.
따라서 2hF(x+h)−F(x−h)는 두 점의 기울기로 해석할 수 있다.
이 때, 평균값정리에 의하여 다음이 성립한다.
∃ ϵ s.t x−h<ϵ<x+h, P(x−h<X<x+h)=F(x+h)−F(x−h)=f(ϵ)⋅2h≈f(x)⋅2h
따라서 P(x−h<X<x+h)=f(ϵ)⋅2h≈f(x)⋅2h라는 결론이 나온다.
표본의 관점에서 생각해 볼 때, P(x−h<X<x+h)는 x-h와 x+h 사이에 표본의 실현 값이 속할 확률이다. 따라서 이산형 확률 변수의 케이스에서와 비슷하게 베르누이 시행을 정의할 수 있다.
Ii(x)={1 (x−h<Xi<x+h)0 (else)P(x−h<Xi<x+h)=f(ϵ)⋅2h
여기서 한 구간의 너비(2h)를 bandwidth, Ii(x) 함수를 rectangular kernel이라고 한다.
이제 f(x)의 추정량 f^(x)를 다음과 같이 정의하면, 점근적인 불편추정량을 얻을 수 있다.
f^(x)=2hn1i=1∑nIi(x)E(f^(x))=2hn1nf(ϵ)⋅2h=f(ϵ)→f(x)
f(x) 전체의 추정
위에서는 단일한 x에서의 f(x)의 추정량을 알아보았다. 이를 확장하여 확률함수의 서포트를 구간으로 나누고, 각 구간의 대푯값을 이용해 위 추정법을 적용하면 f(x) 전체의 추정을 할 수 있다.
m : 나눌 구간의 개수
h : 각 구간 너비의 절반
a : 시작점 ; a<min(xi)
(a−h,a+h],(a+h,a+3h],...,(a+(2m−3)h,a+(2m−1)h]
위와 같이 겹치지 않도록 구간을 나누어 준다. 이 때 m은 전체 구간이 max(xi)를 포함할 수 있도록 충분히 큰 수로 지정해야 한다.
Aj=(a+(2j−3)h,a+(2j−1)h] for j=1,2,...,mf^h(x)=2hn#({xi∈Aj})
임의의 x에 대해, f(x)의 전체 추정은 다음 순서로 이루어 진다.
- x가 어떤 Aj에 속하는 지 확인한다.
- 위에서 다루었던 추정법을 이용해 f(x)의 추정량을 2hn(표본에서 Aj에 속하는 개수)으로 정한다.