조건부 확률 분포 설명

Bean·2025년 4월 7일
0

수학

목록 보기
3/13

조건부 확률 분포란?

조건부 확률 분포는 어떤 사건이나 변수가 주어졌을 때, 다른 사건이 일어날 확률이 어떻게 분포되는지를 나타냅니다. 인공지능 논문을 읽다보면 수식에서 조건부 확률 분포 표현이 많다보니, 해당 포스트에 개념을 정리했습니다.


1. 기본 개념: 조건부 확률

조건부 확률 P(AB)P(A \mid B) 는 “B가 일어났다는 조건 하에 A가 일어날 확률”을 의미합니다.

공식은 다음과 같습니다:

P(AB)=P(A,B)P(B)(단, P(B)>0)P(A \mid B) = \frac{P(A, B)}{P(B)} \quad \text{(단, } P(B) > 0 \text{)}


2. 조건부 확률 분포의 예

확률 분포는 “가능한 모든 값에 대한 확률을 나열한 것”이니까, 조건부 확률 분포는 다음과 같이 됩니다:

예를 들어 두 확률 변수 XX, YY가 있을 때,

p(xy) 는 Y=y라는 조건 하에서 X가 어떤 값을 가질 확률 분포p(x \mid y) \text{ 는 } Y = y \text{라는 조건 하에서 } X \text{가 어떤 값을 가질 확률 분포}

즉, Y=yY = y일 때 XX의 값에 따라 확률이 어떻게 달라지는지를 보여주는 분포입니다.


3. 예시

학생들의 수학 점수 XX와 성별 YY가 있다고 해봅시다.

  • p(xY=)p(x \mid Y = \text{남}): 남학생들의 점수 분포
  • p(xY=)p(x \mid Y = \text{여}): 여학생들의 점수 분포

즉, 성별이라는 조건이 주어졌을 때의 점수 분포가 조건부 확률 분포입니다.


4. 머신러닝에서의 조건부 확률 분포

4.1. 머신러닝 활용 예시

  • Naive Bayes: p(labelfeatures)p(\text{label} \mid \text{features})
  • VAE: p(xz)p(x \mid z)
    → 잠재변수 zz가 주어졌을 때 관측값 xx의 분포 (즉, 하나의 zz에서 확률적으로 여러가지 xx가 생성됩니다.)

4.2. 최대우도추정 (Maximum Likelihood Estimation, MLE)

수식:

θ=argmaxθp(데이터θ)\theta^* = \arg\max_{\theta} p(\text{데이터} \mid \theta)

이 표현은 최대우도추정(MLE)을 나타냅니다.

arg max\argmax는 어떤 값을 넣었을 때 함수의 출력이 최대가 되는 인풋을 찾는다는 뜻입니다.
예시:

argmaxxf(x)\arg\max_{x} f(x)

→ 함수 f(x)f(x)최대가 되는 xx을 구하는 것!

θ=argmaxθp(데이터θ)\theta^* = \arg\max_{\theta} p(\text{데이터} \mid \theta)

→ "데이터가 주어졌을 때, 그 데이터를 가장 잘 설명해주는 모델 파라미터 θ\theta를 찾자"
→ 즉, 학습을 통해 최고의 모델 파라미터 θ\theta를 찾는 과정입니다.

여기서 데이터는 보통 다음을 의미합니다:

  • 입력 xx 와 정답 yy 쌍 전체

  • 또는 전체 학습 데이터셋:
    D={(xi,yi)}i=1ND = \{ (x_i, y_i) \}_{i=1}^{N}

  • p(데이터θ)p(데이터 | θ)모델이 데이터셋을 얼마나 잘 설명하는지에 대한 확률입니다.

  • 네트워크 출력은 이 확률을 예측하기 위한 도구이고,

  • 데이터 자체는 모델이 맞춰야 할 정답 값들입니다.

예시

  • 입력 이미지: 고양이 사진 xx
  • 정답 라벨: 고양이 yy
  • 모델 파라미터: θ\theta

모델의 예측 확률:

p(yx;θ)p(y \mid x; \theta)

→ 모델이 xx를 보고 yy일 확률을 얼마나 높게 예측하는지를 의미합니다.

학습의 목표는 이 확률이 커지도록,
우도(likelihood)를 최대화하도록 θ\theta를 조정하는 것입니다.

개념설명
arg maxθ\argmax_{\theta}어떤 θ\theta 값이 확률을 가장 크게 만드는지 찾는 것
p(데이터θ)p(\text{데이터} \mid \theta)모델이 데이터를 잘 설명할 확률 (우도)
데이터학습에 사용되는 (x,y)(x, y) 쌍 또는 전체 데이터셋
학습의 목적우도를 최대화하는 파라미터 θ\theta 찾기

5. 요약

용어의미
조건부 확률 P(AB)P(A \mid B)B가 일어났을 때 A가 일어날 확률
조건부 확률 분포 p(xy)p(x \mid y)Y가 주어졌을 때 X의 전체 확률 분포
중요한 점주어진 조건에 따라 확률이 바뀐다
활용 예시베이즈 정리, 생성 모델, VAE, 분류 모델 등
profile
AI developer

0개의 댓글