이산형 확률 변수는 특정 값들이 분리되어 있는 경우를 말하며, 셀 수 있는 유한 개 또는 무한 개의 값을 가질 수 있습니다.
연속형 확률 변수는 특정 범위 내에서 무한히 많은 값을 가질 수 있으며, 값이 연속적입니다.
구분 | 이산형 확률 변수 | 연속형 확률 변수 |
---|---|---|
값의 특징 | 분리된 값 (정수형, 셀 수 있음) | 연속된 값 (무한히 많은 실수 값 가능) |
확률 계산 방법 | 특정 값의 확률 ( P(X = x) ) 직접 계산 | 구간 확률 ( P(a \leq X \leq b) ) = 적분값으로 계산 |
표현 방법 | 확률 질량 함수(PMF) | 확률 밀도 함수(PDF) |
그래프 형태 | 막대 그래프 | 연속 곡선 |
예시 | 주사위 결과, 고객 수, 판매된 상품 개수 | 키, 체중, 온도, 시간 |
구분 | PMF (Probability Mass Function) | PDF (Probability Density Function) | CDF (Cumulative Distribution Function) |
---|---|---|---|
정의 | 이산형 확률 변수에서 특정 값 ( X = x )일 확률 | 연속형 확률 변수에서 특정 값 근처의 확률 밀도 ( f(x) ) | 확률 변수 ( X )가 특정 값 이하 ( P(X \leq x) )일 확률의 누적 값 |
적용 대상 | 이산 확률 분포 (예: 베르누이, 포아송, 기하 분포) | 연속 확률 분포 (예: 정규, 균등, 지수 분포) | 이산/연속 확률 분포 모두 적용 가능 |
범위 | ( P(X = x) ), 0 이상 1 이하의 값 | 특정 값의 ( f(x) )는 0 이상, 적분 값은 1 | 0에서 1 사이 |
확률 계산 방법 | 특정 값의 확률 자체를 사용 | 구간 내 확률은 PDF를 적분 ( P(a \leq X \leq b) = \int_a^b f(x) dx ) | 구간 확률은 ( F(b) - F(a) )로 계산 가능 |
특징 | 확률 질량 함수: 특정 값의 확률을 직접 표현 | 확률 밀도 함수: 점에서의 값은 의미 없고 구간으로 해석 | 단조 증가 함수로 누적된 확률을 제공 |
시각화 | 특정 값마다 막대 그래프로 표현 가능 | 연속적인 곡선 그래프로 표현 가능 | 누적된 곡선으로 시각화 가능 |
예시 (현업) | 하루에 주문이 5건일 확률 계산 (( P(X=5) )) | 키가 170cm 근처일 확률 밀도 (( f(x=170) )) | 하루 주문이 5건 이하일 누적 확률 (( P(X \leq 5) )) |
분포 | PMF (막대) | PDF (곡선) | CDF (누적 곡선) |
---|---|---|---|
포아송 분포 | 각 주문량별 확률 | (해당 없음: 연속 분포가 아니므로 PDF가 정의되지 않음) | 하루에 특정 주문량 이하로 처리될 확률의 누적 곡선 |
정규 분포 | (해당 없음: 이산 분포가 아니므로 PMF가 정의되지 않음) | 특정 키 근처의 밀도 곡선 | 특정 키 이하일 확률의 누적 곡선 |
이처럼 세 가지 개념을 구분하여 사용하면 데이터를 더 깊이 이해하고, 의사결정을 위한 유용한 정보를 도출할 수 있습니다.