균등분포, 정규분포

Mini·2025년 1월 31일

확률이론

목록 보기
7/7

1. 균등분포 (Uniform Distribution)

균등분포는 모든 값이 동일한 확률로 발생하는 분포이다.
즉, 주어진 구간 내에서 모든 값이 같은 확률을 가지는 분포를 의미한다.

확률변수 ( X ) 가 구간 ( [a, b] ) 에서 균등하게 분포하면:

XU(a,b)X \sim U(a, b)

균등분포의 확률밀도함수(PDF)는 다음과 같다.

p(X)={1ba,aXb0,otherwisep(X) = \begin{cases} \frac{1}{b-a}, & a \leq X \leq b \\ 0, & \text{otherwise} \end{cases}

특징

  • 구간 ( [a, b] ) 내의 모든 값이 동일한 확률을 가짐

  • 기대값(Mean):

    E[X]=a+b2E[X] = \frac{a + b}{2}
  • 분산(Variance):

    Var(X)=(ba)212\text{Var}(X) = \frac{(b - a)^2}{12}

균등분포는 난수 생성, 실험 설계 등에서 자주 사용된다.


2. 정규분포 (Normal Distribution)

정규분포는 자연에서 가장 흔하게 나타나는 확률 분포이며,
대부분의 통계적 분석과 머신러닝에서 기본적으로 가정하는 분포이다.

정규분포는 다음과 같이 표현한다.

XN(μ,σ2)X \sim N(\mu, \sigma^2)

정규분포의 확률밀도함수(PDF)는 다음과 같다.

p(X)=12πσ2e(Xμ)22σ2p(X) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(X - \mu)^2}{2\sigma^2}}

여기서,

  • μ\mu (뮤): 평균(Mean)
  • σ2\sigma^2 (시그마 제곱): 분산(Variance)
  • σ\sigma (시그마): 표준편차(Standard Deviation)

특징

  • 대칭적 분포: 평균을 중심으로 좌우가 대칭을 이룸

3. 정규분포가 중요한 이유

1) 많은 자연 현상이 정규분포를 따름

  • 사람의 키, 체중, 시험 성적 등 다양한 데이터가 정규분포를 따르는 경향이 있음
  • 데이터가 많아질수록 정규분포의 형태에 가까워짐

2) 중심극한정리 (Central Limit Theorem, CLT)

  • 모집단의 분포가 어떠하든 표본 평균의 분포는 정규분포에 가까워짐
  • 많은 통계적 분석과 가설 검정이 정규분포를 가정하고 있음

3) 머신러닝과 데이터 분석에서 필수적인 분포

  • 선형 회귀, 로지스틱 회귀 등 대부분의 모델이 정규분포 가정 하에 동작
  • 데이터가 정규분포를 따를 경우, 해석과 예측이 쉬움
profile
꾸준히, 의미있는 학습을 기록하기 위한 공간입니다.

0개의 댓글