확률의 개념과 확률 분포

Mini·2025년 1월 27일

확률이론

목록 보기

1/7

1. 확률이란?

확률 = (특정한 경우의 수) / (모든 경우의 수)

경우의 수는 길이, 면적, 부피 등의 물리적인 값으로 확장 가능하지만,
이러한 경우의 수를 구하기 어려운 환경에서는 다른 방식으로 확률을 정의할 필요가 있음!

확률의 재정의

무작위(random)로 나타나는 어떤 현상이 발생하거나 존재할 가능성의 크기

🏷️ 0(발생 안함)과 1(항상 발생)은 무작위성이 없기 때문에 확률적으로 무의미

확률의 조건

무작위성(Randomness)

어떤 사건이 예측 불가능한 방식으로 발생해야함

확률 대상의 범위 제한

확률은 특정 실험(Trial, Experiment)에서 발생할 수 있는 모든 경우를 포함해야함
이때, 이 전체 집합을 표본 공간(Sample Space)이라고 한다.

🏷️ 표본 공간 내에서 발생 가능한 모든 사건의 확률의 합 = 1

확률을 배우는 이유

일상생활에서는 무작위적인 요소들이 많아 정확한 예측이 어렵다.
BUT 무작위적이지만 예측 가능한 패턴

예를 들어,
주사위 {1,2,3,4,5,6}의 경우, 어떤 숫자가 나올지 모름 → 예측 불가능
그러나 주사위 {1,1,1,2,3,4}의 경우, 1이 나올 확률이 상대적으로 높음 → 예측 가능

이처럼 확률을 통해 특정 사건이 발생할 가능성을 수치적으로 분석할 수 있고,
확률 이론을 활용하면 예측 가능성을 높일 수 있다

❗️확률 이론의 주요 목표

무작위 현상의 확률 특성과 분포 파악 -> 수학적, 통계적 모델로 표현
추정, 예측, 판별 학습 등에 대한 확률적 해석

2. 확률 변수와 확률 분포

어떻게 Random 현상과 확률을 수학적으로 다룰 것인가?

확률 변수 (Random Variable) = 정의역(Domain)

확률을 갖는 무작위 현상을 숫자(정수, 실수)에 대응
ex) 동전을 던졌을 때 앞면(H) = 1, 뒷면(T) = 0으로 변환

🏷️ 물리적, 논리적으로 의미가 있는 값과 대응

이산 확률 변수

일반적으로 정수값에 대응하는 확률 변수
개수, 횟수 등과 관련
ex) 이항 분포, 포아송 분포

연속 확률 분포

특정한 구간의 모든 실수값에 대응하는 확률 변수
특정한 구간에서 어떠한 실수값이든 무한하게 나올 수 있는 경우
ex) 정규 분포

❗️실제 변수를 다룰 때는 유한한 개수의 이산 변수로 다루는 경우가 많음
ex) 일정한 간격으로 확률 변수를 양자화, 연속확률밀도함수를 확률분포함수로 적용

확률 분포 (Porbability Distribution) = 치역(Range)

확률 분포 - 무작위 현상 각각에 대해 확률값을 정의

확률 분포 함수 - 확률 변수와 그에 해당하는 확률(또는 확률밀도)을 함수로 표현

x(정의역) - 확률변수
y(치역) - 확률(이산), 확률밀도(연속)

모델링

Mini

꾸준히, 의미있는 학습을 기록하기 위한 공간입니다.

다음 포스트