확률 변수와 확률 분포

rokky·2023년 3월 6일

통계

목록 보기
2/17

시행과 사건

  • 시행(trial): 반복 가능하며 매번 결과가 달라질 수 있는 실험 ex) 주사위 2개를 던지는 행위
  • 사건(event): 시행에 따른 결과를 의미 ex) 눈금의 합이 3이 되는 사건

확률

  • 어떠한 사건이 일어날 가능성을 수로 표현한 것

확률 변수

  • 사건으로 인해 그 값이 확률적으로 정해지는 변수
  • 주사위 2개를 던지는 시행을 할 때마다 눈금의 합은 변할 수 있다.(확률변수 = 눈금 합)
  • 확률 변수는 X로 표기, 확률 변수가 취할 수 있는 값은 x로 표현

확률 함수

  • 확률 함수란 확률 변수에 따라서 확률 값을 부여하는 함수
  • 일반적으로 P라고 한다.
  • 주사위 2개 던지기를 시행 했을 때 눈금의 합이 2가 나올 확률은 1/36이다.
    P(X = 2) = 1/36

확률 변수 예시

ex1)

  • 앞면 1, 뒷면 0인 2개의 동전 존재
  • 시행: 동전 2개를 동시에 던짐
  • 확률 변수 X: 두 눈금의 합
  • 가능한 X값 0,1,2
  • 시행마다 X값이 달라질 수 있으므로, 확률적으로 변할 수 있다고 하여 X를 확률 변수라고 한다.

ex2)

  • 2개의 동전을 던지는 시행에 대하여
  • 수학적으로 각 사건 확률
  • 눈금의 합이 0인 사건이 발생할 확률: P(X=0) = 1/4
  • 눈금의 합이 1인 사건이 발생할 확률: P(X=1) = 1/2
  • 눈금의 합이 2인 사건이 발생할 확률: P(X=2) = 1/4

딥러닝 분야에서의 사건

  • 우리가 얻을 수 있는 데이터는 "사건"
  • 이미지 분류 모델 학습 시 다양한 이미지를 사용
  • 내가 수집하여 가지고 있는 이미지를 사건으로 이해가능
  • P(x)의 의미?
    존재하는 모든 이미지 중에서 이미지 x가 나올 확률을 의미

확률 변수는 함수이다?

  • 표본 공간(sample space): 발생 가능한 모든 사건들의 집합(전체 집합)
  • 확률 변수는 표본 공간 안에서 특정 확률로 발생하는 사건을 특정 수치에 대응시키는 함수
  • 이때 확률 변수가 취할 수 있는 모든 값 x의 집합을 상태 공간(state space)라고 한다.

확률 분포

  • 각 사건에 어느 정도의 확률이 할당되었는지 표현한 정보
  • 이를 이용해 통계적 특성을 쉽게 이해할 수 있다.

확률 분포 함수

  • 확률 변수 X가 가지는 값 x에 확률 P(X=x)을 대응시키는 함수
    1. 확률 질량 함수, 2.확률 밀도 함수 존재
  • 모든 사건에 대해 확률 분포 함수 값을 표현한 것을 확률 분포로 이해할 수 있다.

함수로 이해하기

  • 확률 변수와 확률 분포 함수 모두 함수로 이해 가능
    사건 -(확률 변수 X)-> 실수 -(확률 분포 함수)-> 확률 값

이산확률분포

  • 확률 변수 X가 취할 수 있는 모든 값을 셀 수 있을 경우, 이산확률 변수라고 한다.
  • 이산 확률 분포는 이산확률 변수의 확률 분포를 의미
  • 주사위를 던졌을 때 나올 수 있는 눈금 {1,2,3,4,5,6}중 하나
  • "주사위 눈금"의 값은 6개(셀 수 있음)만 존재하므로 이산확률 변수이다.

이산확률분포 예시

  • 주사위를 던질 때 나올 수 있는 눈금의 수를 X라고 하자
  • 확률 변수 X는 {1,2,3,4,5,6} 중 하나의 값을 가질 수 있다.
  • P(X=1)=P(X=2)=P(X=3)=P(X=4)=P(X=5)=P(X=6) = 1/6 (이산 균등 분포:모든 확률 변수가 나올 확률 동일한 분포)

확률질량함수

  • 확률질량함수는 이산확률변수가 특정한 값을 가질 확률을 출력하는 함수
  • 확률질량함수는 이산확률분포를 표현하기 위해 사용하는 확률분포함수로 이해할 수 있다.
  • 동전 2개를 던지는 시행에서 두 눈금의 합을 X라고 하자
  • 이때 X는 이산확률변수로, 확률질량함수 f(x)는 다음과 같이 정의 가능
    f(0) = P(X=0) = 1/4
    f(1) = P(X=1) = 1/2
    f(2) = P(X=2) = 1/4
  • 확률 변수 X에 대한 확률 질량함수라는 의미로 fx(x)라고 표기하기도 한다.

확률질량함수 예시

  • 딥러닝에서 확률 분포에 대해 이해 필요

  • 분류(classification) 모델의 출력은 확률 분포에 해당한다.

  • 이미지 x가 주어졌을 때 클래스 y의 확률을 P(yㅣx) 로 표현 가능

  • 확률 변수 X의 값에 따라 Y의 확률 분포가 변경된다는 의미에서 조건부 확률이라 한다.
    이미지 x
    P(Y = 새ㅣX = x) = 0.06
    P(Y = 코끼리ㅣX = x) = 0.87
    P(Y = 벌ㅣX = x) = 0.07

  • 한장의 이미지 x가 주어졌을 때, 분류 모델의 실행 결과가 다음과 같다고 하자

  • P(Y = 고양이ㅣX = x) = 15%

  • P(Y = 강아지ㅣX = x) = 55%

  • P(Y = 다람쥐ㅣX = x) = 30%
    이미지 x -> 딥러닝 모델 -> 추론 결과

  • P(YㅣX) 는 X값이 주어졌을 때 확률 변수 Y에 대한 확률 분포를 의미
    X가 이미지, Y가 클래스라고 하면, 한장의 이미지가 어떤 동물인지 예측하는 모델의 출력 결과로 이해

  • 이때의 모델을 확률질량함수로 이해할 수 있다.

연속확률변수

  • 확률변수 X가 취할 수 있는 값이 무한한 경우 (ex) 키, 달리기 성적....)

확률밀도함수

  • 연속확률변수가 주어진 구간 내에 포함될 확률을 출력하는 함수(ex) 정규분포)

0개의 댓글