확률 변수와 확률 분포

rokky·2023년 3월 6일

통계

목록 보기

2/17

시행과 사건

시행(trial): 반복 가능하며 매번 결과가 달라질 수 있는 실험 ex) 주사위 2개를 던지는 행위
사건(event): 시행에 따른 결과를 의미 ex) 눈금의 합이 3이 되는 사건

확률

어떠한 사건이 일어날 가능성을 수로 표현한 것

확률 변수

사건으로 인해 그 값이 확률적으로 정해지는 변수
주사위 2개를 던지는 시행을 할 때마다 눈금의 합은 변할 수 있다.(확률변수 = 눈금 합)
확률 변수는 X로 표기, 확률 변수가 취할 수 있는 값은 x로 표현

확률 함수

확률 함수란 확률 변수에 따라서 확률 값을 부여하는 함수
일반적으로 P라고 한다.
주사위 2개 던지기를 시행 했을 때 눈금의 합이 2가 나올 확률은 1/36이다.
P(X = 2) = 1/36

확률 변수 예시

ex1)

앞면 1, 뒷면 0인 2개의 동전 존재
시행: 동전 2개를 동시에 던짐
확률 변수 X: 두 눈금의 합
가능한 X값 0,1,2
시행마다 X값이 달라질 수 있으므로, 확률적으로 변할 수 있다고 하여 X를 확률 변수라고 한다.

ex2)

2개의 동전을 던지는 시행에 대하여
수학적으로 각 사건 확률
눈금의 합이 0인 사건이 발생할 확률: P(X=0) = 1/4
눈금의 합이 1인 사건이 발생할 확률: P(X=1) = 1/2
눈금의 합이 2인 사건이 발생할 확률: P(X=2) = 1/4

딥러닝 분야에서의 사건

우리가 얻을 수 있는 데이터는 "사건"
이미지 분류 모델 학습 시 다양한 이미지를 사용
내가 수집하여 가지고 있는 이미지를 사건으로 이해가능
P(x)의 의미?
존재하는 모든 이미지 중에서 이미지 x가 나올 확률을 의미

확률 변수는 함수이다?

표본 공간(sample space): 발생 가능한 모든 사건들의 집합(전체 집합)
확률 변수는 표본 공간 안에서 특정 확률로 발생하는 사건을 특정 수치에 대응시키는 함수
이때 확률 변수가 취할 수 있는 모든 값 x의 집합을 상태 공간(state space)라고 한다.

확률 분포

각 사건에 어느 정도의 확률이 할당되었는지 표현한 정보
이를 이용해 통계적 특성을 쉽게 이해할 수 있다.

확률 분포 함수

확률 변수 X가 가지는 값 x에 확률 P(X=x)을 대응시키는 함수
1. 확률 질량 함수, 2.확률 밀도 함수 존재
모든 사건에 대해 확률 분포 함수 값을 표현한 것을 확률 분포로 이해할 수 있다.

함수로 이해하기

확률 변수와 확률 분포 함수 모두 함수로 이해 가능
사건 -(확률 변수 X)-> 실수 -(확률 분포 함수)-> 확률 값

이산확률분포

확률 변수 X가 취할 수 있는 모든 값을 셀 수 있을 경우, 이산확률 변수라고 한다.
이산 확률 분포는 이산확률 변수의 확률 분포를 의미
주사위를 던졌을 때 나올 수 있는 눈금 {1,2,3,4,5,6}중 하나
"주사위 눈금"의 값은 6개(셀 수 있음)만 존재하므로 이산확률 변수이다.

이산확률분포 예시

주사위를 던질 때 나올 수 있는 눈금의 수를 X라고 하자
확률 변수 X는 {1,2,3,4,5,6} 중 하나의 값을 가질 수 있다.
P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6) = 1/6 (이산 균등 분포:모든 확률 변수가 나올 확률 동일한 분포)

확률질량함수

확률질량함수는 이산확률변수가 특정한 값을 가질 확률을 출력하는 함수
확률질량함수는 이산확률분포를 표현하기 위해 사용하는 확률분포함수로 이해할 수 있다.
동전 2개를 던지는 시행에서 두 눈금의 합을 X라고 하자
이때 X는 이산확률변수로, 확률질량함수 f(x)는 다음과 같이 정의 가능
f(0) = P(X=0) = 1/4
f(1) = P(X=1) = 1/2
f(2) = P(X=2) = 1/4
확률 변수 X에 대한 확률 질량함수라는 의미로 fx(x)라고 표기하기도 한다.

확률질량함수 예시

딥러닝에서 확률 분포에 대해 이해 필요
분류(classification) 모델의 출력은 확률 분포에 해당한다.
이미지 x가 주어졌을 때 클래스 y의 확률을 P(yㅣx) 로 표현 가능
확률 변수 X의 값에 따라 Y의 확률 분포가 변경된다는 의미에서 조건부 확률이라 한다.
이미지 x
P(Y = 새ㅣX = x) = 0.06
P(Y = 코끼리ㅣX = x) = 0.87
P(Y = 벌ㅣX = x) = 0.07
한장의 이미지 x가 주어졌을 때, 분류 모델의 실행 결과가 다음과 같다고 하자
P(Y = 고양이ㅣX = x) = 15%
P(Y = 강아지ㅣX = x) = 55%
P(Y = 다람쥐ㅣX = x) = 30%
이미지 x -> 딥러닝 모델 -> 추론 결과
P(YㅣX) 는 X값이 주어졌을 때 확률 변수 Y에 대한 확률 분포를 의미
X가 이미지, Y가 클래스라고 하면, 한장의 이미지가 어떤 동물인지 예측하는 모델의 출력 결과로 이해
이때의 모델을 확률질량함수로 이해할 수 있다.

연속확률변수

확률변수 X가 취할 수 있는 값이 무한한 경우 (ex) 키, 달리기 성적....)

확률밀도함수

연속확률변수가 주어진 구간 내에 포함될 확률을 출력하는 함수(ex) 정규분포)

rokky

이전 포스트

확률 개요

다음 포스트

확률 변수와 확률 분포

통계

시행과 사건

확률

확률 변수

확률 함수

확률 변수 예시

딥러닝 분야에서의 사건

확률 변수는 함수이다?

확률 분포

확률 분포 함수

함수로 이해하기

이산확률분포

이산확률분포 예시

확률질량함수

확률질량함수 예시

연속확률변수

확률밀도함수

확률 개요

이산확률분포

0개의 댓글