해당 시리즈에서는 데이터 사이언스 인터뷰 질문 모음집 에서 소개한 질문들에 대한 답변을 다룹니다.
궁금한 사항, 혹은 잘못된 내용 발견시 댓글 부탁드립니다.
문제 정의
해당 문제는 베이즈 정리로 풀 수 있습니다. 다음과 같이 사건을 정의합시다.
A: 실제로 비가 내리는 사건
B: 3명의 친구가 모두 "그렇습니다. 비가 내리고 있습니다."라고 얘기한 사건
그렇다면 우리가 구하고 싶은 확률
"친구들이 모두 yes라고 말했을 때, 출장지에 비가 내리고 있을 확률"
은 베이즈 정리에 따라 아래와 같습니다.
P(A∣B)=P(B∣A) P(B)P(A)
따라서 이를 해결하기 위해 우리는 P(A), P(B), P(B∣A) 를 알아야 합니다.
P(A)
P(A), 즉 출장지에 비가 내릴 확률은 모릅니다. 임의로 p라고 합시다.
P(B)
P(B), 3명의 친구 모두 비가 내린다고 대답할 확률은 아래와 같이 두가지 경우로 나눌 수 있습니다.
1) 비가 내리면서 친구들이 모두 진실을 말하는 경우와,
2) 비가 내리지 않고 친구들이 모두 거짓을 말하는 경우.
따라서 P(B)는 아래와 같습니다.
P(B)=P(B∣A) P(A)+P(B∣Ac) P(Ac)
P(B∣A)는 친구들이 모두 진실을 말하는 상황이므로 P(B∣A)=(2/3)3=8/27 입니다.
P(A)=p 입니다.
P(B∣Ac)는 친구들이 모두 거짓을 말하는 상황이므로 P(B∣Ac)=(1/3)3=1/27 입니다.
P(Ac)=1−p 입니다.
이를 대입하면 아래와 같습니다.
P(B)=278 p+271 (1−p)
P(B|A)
이미 위에서 P(B)를 구하는 과정에서 구했습니다.
P(B∣A)=8/27 입니다.
결과
앞서 구한 P(A),P(B),P(B∣A)를 이용하여 P(A∣B)를 계산하면 아래와 같습니다.
P(A∣B)=P(B∣A) P(B)P(A)=278 278 p+271 (1−p)p=8p+(1−p)8p=7p+18p
출장지에 실제로 비가 올 확률 p에 따라서 결과가 달라짐을 확인할 수 있습니다. 예를 들어,
출장지에 항상 비가 오는 경우, 친구들이 무슨 말을 하더라도 출장지에는 비가 옵니다.
즉, P(A∣B)=1,when p=1
반대로 출장지에 비가 절대로 오지 않는 경우, 친구들이 무슨 말을 하더라도 출장지에는 비가 오지 않습니다.
즉, P(A∣B)=0,when p=0