균등분포는 모든 값이 동일한 확률로 발생하는 분포이다.
즉, 주어진 구간 내에서 모든 값이 같은 확률을 가지는 분포를 의미한다.
확률변수 ( X ) 가 구간 ( [a, b] ) 에서 균등하게 분포하면:
X∼U(a,b)
균등분포의 확률밀도함수(PDF)는 다음과 같다.
p(X)={b−a1,0,a≤X≤botherwise
특징
균등분포는 난수 생성, 실험 설계 등에서 자주 사용된다.
2. 정규분포 (Normal Distribution)
정규분포는 자연에서 가장 흔하게 나타나는 확률 분포이며,
대부분의 통계적 분석과 머신러닝에서 기본적으로 가정하는 분포이다.
정규분포는 다음과 같이 표현한다.
X∼N(μ,σ2)
정규분포의 확률밀도함수(PDF)는 다음과 같다.
p(X)=2πσ21e−2σ2(X−μ)2
여기서,
- μ (뮤): 평균(Mean)
- σ2 (시그마 제곱): 분산(Variance)
- σ (시그마): 표준편차(Standard Deviation)
특징
- 대칭적 분포: 평균을 중심으로 좌우가 대칭을 이룸
3. 정규분포가 중요한 이유
1) 많은 자연 현상이 정규분포를 따름
- 사람의 키, 체중, 시험 성적 등 다양한 데이터가 정규분포를 따르는 경향이 있음
- 데이터가 많아질수록 정규분포의 형태에 가까워짐
2) 중심극한정리 (Central Limit Theorem, CLT)
- 모집단의 분포가 어떠하든 표본 평균의 분포는 정규분포에 가까워짐
- 많은 통계적 분석과 가설 검정이 정규분포를 가정하고 있음
3) 머신러닝과 데이터 분석에서 필수적인 분포
- 선형 회귀, 로지스틱 회귀 등 대부분의 모델이 정규분포 가정 하에 동작
- 데이터가 정규분포를 따를 경우, 해석과 예측이 쉬움