Probability(확률) vs Likelihood(가능성)

Bobae·2023년 10월 19일

머신러닝, 통계, 데이터 쪽을 공부하다보면 항상 보게 되는 terms들이 있습니다.
probability와 likelihood입니다.

사실 두 값은 되게 비슷해보이지만, 실제로는 다른 값입니다.

해당 컨텐츠는 유튜브 StatQuest에 아주 친절하게 설명되어있습니다.

Normal Distribution (정규분포)

실제세계에서 많은 데이터들은 정규분포로써 설명될 수 있습니다.

데이터들이 mean(평균)근처에 많이 존재하고, 특정 standard deviation(표준편차)를 가지는 분포 형태입니다. 우리는 normal distribution을 연속적인 데이터에 적용시킬 수도 있습니다.


Probability (확률)

우리에게 쥐의 몸무게 데이터가 주어져있다고 가정합니다.

이 쥐의 몸무게 데이터는 32 grams의 평균값을 가지고 있고, 2.5의 표준편차 값을 가지고 있습니다. 또한 가장 작은 값으로는 24 grams, 큰 값으로는 40 grams의 데이터 분포 형태를 가지고 있습니다.

이때, 우리는 몸무게가 32~34grams인 쥐들이 선택될 probability 확률을 알고 싶습니다. 32~34 grams인 쥐들이 선택될 확률은 다음과 같이 커브 아래부분의 영역으로 표현될 수 있으며, 해당 예시에서는 0.29, 29% 확률로, 랜덤하게 선택될 수 있다는 것을 알 수 있습니다.

이것을 수학공식으로 notation을 나타내게 된다면, 다음과 같이 표현할 수 있습니다.

P(32<=weight<=34P(32<=weight<=34 | μ=32,σ=2.5)=0.29μ=32, σ=2.5) = 0.29

왼쪽 term은 쥐의 무게가 32와 34 사이의 확률을 표현한 것이며,
오른쪽 term은 평균이 32, 표준편차가 2.5인 분포를 표현한 것입니다.
즉, 평균 32 표준편차 2.5인 분포가 주어졌을 때, 쥐의 무게가 32와 34사이의 확률은? 이라고 해석 할 수 있겠습니다.

만약 다른 조건의 확률을 알고 싶다면, 수식을 조금 변경시켜야겠죠?
P(weight>=34P(weight>=34 | μ=32,σ=2.5)μ=32, σ=2.5) = less than 0.29
그래프의 모양을 확인했을 때, 정확한 값을 알 수는 없지만, 0.29보다는 훨씬 작은 값일 것입니다 (커브 모양의 아래부분)

여기서 알 수 있는 사실은, 우리가 다른 조건의 확률을 알고 싶을때는, 왼쪽 term을 바꿀 수 있다는 사실입니다.


Likelihood (가능성)

가능성을 설명하기 위해서,우리는 이미 쥐의 무게를 측정한 상태라고 가정합니다.
우리의 쥐는 34 grams의 무게를 가지고 있습니다. 34 grams의 무게를 가진 가능성은 커브모양의 값으로 표현될 수 있습니다. 여기서는 0.12입니다.

이것을 수학공식으로 notation을 나타내게 된다면, 다음과 같이 표현할 수 있습니다.

L(μ=32,σ=2.5L(μ=32, σ=2.5 | weight=34)=0.12weight=34) = 0.12

왼쪽 term은 평균이 32, 표준편차가 2.5일때 가능성을 가정한 것입니다.
오른쪽 term은 쥐의 무게가 34인 조건입니다.
즉, 쥐의 무게가 34일때, 평균이 32이고 표준편차가 2.5인 분포에서의 가능성은? 이라고 해석 할 수 있겠습니다.

우리는 왼쪽 term을 조금 변경시켜서 다른 가능성을 확인할 수 있습니다.

L(μ=34,σ=2.5L(μ=34, σ=2.5 | weight=34)=0.21weight=34) = 0.21
쥐의 무게가 34일때, 평균이 34이고 표준편차가 2.5인 분포에서의 가능성은?


요약하자면, 정규분포를 따르는 데이터에서, 확률은 분포의 영역을 표현한다고 볼 수 있으며, 가능성은 분포의 y값을 나타냅니다.

Reference
profile
현재 머신러닝, 딥러닝을 공부하고 있습니다.

1개의 댓글

comment-user-thumbnail
2024년 12월 30일

감사합니다!
가능도에 관해서 질문이 있습니다.
가능도는 분포 상에서 데이터의 x위치에 대한 y 값이라고 이해했는데요, 가능도라는 y값은 무엇인가요?
그림에서는 0.05, 0.1, 0.15 등으로 표시되어 있는데 언뜻봐도 1에 도달하기 전에 분포에서 벗어날 것 같아 확률은 아닌 것 같기도하고요.
또한 가능도 y를 계산하는 구체적인 수식도 궁금합니다! 기초 확률 과목에서 배우는 최대 가능도 추정일까요?

답글 달기