Random Variable, Statistic, Parameter

TEMP·2022년 1월 27일
0

개념정리

목록 보기
6/9

통계에서 자칫하면 헷갈릴수 있는 개념들을 정리합니다.

Random Variable

엄밀하게 말하자면 function\color{purple}\small\mathsf{function}입니다.
정의역이 표본공간이고 공역이 실수공간이 함수입니다.
또한 정의역이 실수공간이고 공역이 확률인 함수를 확률 분포(Probability distribution)이라고 합니다.
이건 정의고 다음과 같이 생각하면 됩니다.


Random variable은 변수이므로 constant가 아닙니다. 즉, 우리가 주사위를 던지는 실험은 한다고 해보겠습니다. 이 상황에서 확률변수 XX 무엇일까요? 아직은 정의할 수 없습니다. 그럼 이제 한 문장을 추가해 보겠습니다. "확률 변수 XX는 주사위가 나오는 값으로 하겠습니다." 그럼 이제 확률 변수 X는 1~6 사이의 값을 취할 수 있습니다. 1~6중 어떤 값이 된다는 것이 아닙니다. 1~6은 확률변수XX가 될 수 있는 후보군이라고 보는 것이 맞습니다.
여기까지 보면 확률변수가 뭔지 이해가 잘 되지 않습니다. 하지만 확률 분포까지 한번에 생각하면 이해가 쉬워집니다.

Probability distribution

확률 분포는 확률 변수가 어떤값을 어는정도의 확률로 가질지에 대한 함수입니다. 위에서 확률 변수는 constant가 아닌 variable이라고 하였습니다. 즉, 1~6을 취할 수 있는데 정해질 수가 없습니다. 다만 위의 예시의 경우에서는 동등한 확률로 확률변수 XX는 1~6중 하나일것이라고 생각 할 수 있습니다. 이때 필요한 것이 확률 분포 입니다.
확률 분포는 확률 변수가 1~6까지 mapping될 수 있는 확률이라고 생각하면 됩니다. 즉, 위의 경우에서는 P(X=1)=P(X=2)=...P(X=6)=1/6P(X=1)=P(X=2)=...P(X=6) = 1/6입니다. 이를 해석하자면 수식 그대로 확률 변수 XX가 1~6이 될 확률은 1/61/6으로 동일하다 입니다. 따라서 실수공간을 확률로 mapping하는 function이라고 하는 것입니다.

통합적 이해

이제 확률 변수와 확률 분포를 동시에 이해해 보겠습니다.
Xi.i.dN(0,1)X\sim i.i.d \sim N(0,1) 이 표현을 상당히 많이 봐왔습니다. 이제 위의 개념이 가지고 이 표현을 이해해 보겠습니다.
우선 확률변수XX모집단을대변한다\color{purple}\small\mathsf{모집단을 대변한다}라고 생각하면 됩니다. 즉, 확률 변수XX가 취할 수 있는 값은 모집단에서의 모든 값입니다. 그리고 N(0,1)N(0,1)이라는 것은 모집단을 대변하는 확률변수 XX의 분포라고 이해하면 됩니다.
즉, 어떤 모집단이 있을때 확률변수XX는 모집단의 각 원소를 대변하는 기호이고 그것이 N(0,1)N(0,1)이라는 분포를 따른다는 의미이므로 모집단이 N(0,1)N(0,1)을 따른다고 생각하면 됩니다.
추가로 확률변수가 모집단을 대표하는 기호이기 때문에 당연히 contant가 될수 없는 것이고 이룰 distribution을 통하여 probability로 mapping할 수 있는 것입니다.
또다른 이해로는 E(X)E(X)을 생각해 볼수 있습니다. 이건 아래 parameter에서 더욱 자세하게 다룹니다. 이를 확률변수와 분포로 이해해 보자면 다음과 같습니다. 모집단을 대표하는 변수인 확률변수 XX의 expectation은 모집단의 평균을 의미합니다. 따라서 이를 구하기 위해서는 모집단의 분포를 알면 됩니다. 그것이 바로 모집단을 대표하는 확률변수의 분포인 확률 분포입니다.

Statistic

Parameter

0개의 댓글