확률분포 4가지 종류의 기본 개념 살펴보기

공장장·2024년 9월 17일

# Statistics | 통계학

목록 보기
1/2
post-thumbnail

📌 이산 확률분포 (Discrete Probability Distribution)

  • 이산 확률분포란?
  • 특정한 값만 가질 수 있는 경우를 다루는 분포.
  • 즉, 연속적이지 않고, '뚝뚝 끊어지는' 값을 다룬다고 생각.
  • 예) 주사위를 던졌을 때 나올 수 있는 결과(1, 2, 3, 4, 5, 6)
    • 여기서 가능한 값은 1, 2, 3, 4, 5, 6. 1.5나 3.8 같은 값은 나올 수 없음.
  • 특징: 값이 딱딱 떨어짐. 결과가 정해진 숫자 중 하나로만 나타남.

📌 연속 확률분포 (Continuous Probability Distribution)

  • 연속 확률분포란?
  • 어떤 범위 안에서 모든 실수 값을 가질 수 있는 경우를 다루는 분포.
  • 즉, 값이 연속적으로 나타날 수 있음.
  • 예) 사람의 키
    • 사람의 키는 170cm, 170.5cm, 170.55cm 등등, 무수히 많은 값을 가질 수 있음.
    • 정확히 딱 떨어지는 값이 아니라, 범위 내의 모든 실수 값을 가질 수 있음.
  • 특징: 값이 연속적. 그래프를 그리면 곡선으로 나타남.
  • 아래 처럼 반드시 종모양의 대칭 그래프가 나오는 것은 아니다.
  • 비대칭적 분포를 왜도가 있다고 표현.
    • 예) 지수분포, 카이제곱분포, 베타분포

📌 정규분포 (Normal Distribution)

  • 정규분포란?
  • 데이터가 평균을 중심으로 좌우 대칭으로 분포하는 연속 확률분포.
  • 종 모양의 곡선을 그리는 분포로 많이 알려져 있음.
  • 예) 학생들의 시험 점수
    • 보통 많은 학생들이 평균 근처의 점수를 받고, 평균보다 훨씬 낮거나 높은 점수를 받는 학생은 적다.
    • 이렇게 평균을 중심으로 좌우 대칭으로 퍼지는 모양이 정규분포.
  • 특징: 종 모양으로, 평균을 중심으로 대칭적. 평균, 중앙값, 최빈값이 모두 같음.

📌 표준 정규분포 (Standard Normal Distribution)

  • 표준 정규분포란?
  • 정규분포를 특별하게 만든 버전.
  • 평균이 0이고, 표준편차가 1인 정규분포.
  • 이를 통해 다른 정규분포를 비교하고 해석하기 쉽게 만든 것.
  • 예) 시험 점수를 z-점수로 변환한 경우
  • 특정 학생의 점수가 전체 평균보다 몇 표준편차만큼 떨어져 있는지를 z-점수로 나타냄.
  • 이때 이 z-점수들이 따르는 분포가 표준 정규분포.
  • 특징: 평균이 0, 표준편차가 1인 종 모양 분포. 다른 정규분포와 비교할 때 기준이 되는 분포.
profile
연장 대신 키보드 뚱땅거리며 분석하는 '데이터분석 공장 529'

0개의 댓글