베타 분포

HanJu Han·2024년 12월 2일
0

추천 시스템

목록 보기
24/49
  1. 많은 성공 (Beta(9,3) - 8성공, 2실패)

    • 그래프가 오른쪽(0.7~0.8 부근)으로 치우침
    • 뾰족한 모양은 "이 동전은 앞면이 나올 확률이 약 75%다"라는 강한 확신을 보여줌
    • 하지만 여전히 약간의 불확실성(곡선의 폭)이 존재
  2. 많은 실패 (Beta(3,9) - 2성공, 8실패)

    • 그래프가 왼쪽(0.2~0.3 부근)으로 치우침
    • 1번 케이스를 거울로 뒤집은 것 같은 모양
    • "이 동전은 앞면이 나올 확률이 약 25%다"라는 강한 확신을 보여줌
  3. 매우 많은 시도 (Beta(21,7) - 20성공, 6실패)

    • 가장 뾰족한 모양
    • 시도횟수가 많을수록 곡선이 더 뾰족해짐
    • 많은 데이터로 인해 확률 추정에 대한 매우 강한 확신을 가짐
    • "이 동전은 거의 확실하게 75% 확률로 앞면이 나온다"
  4. 적은 시도 (Beta(2,2) - 1성공, 1실패)

    • 완만한 산 모양
    • 곡선이 넓게 퍼져있어 큰 불확실성을 나타냄
    • "아직 잘 모르겠다. 더 많은 시도가 필요하다"를 의미

중요한 패턴들:
1. 시도횟수가 많아질수록 → 곡선이 더 뾰족해짐
2. 성공이 많으면 → 오른쪽으로 치우침
3. 실패가 많으면 → 왼쪽으로 치우침
4. 성공과 실패가 비슷하면 → 0.5 근처에서 대칭적인 모양

이렇게 베타 분포는 우리의 불확실성을 수학적으로 표현해주며, Thompson Sampling은 이 분포에서 값을 추출함으로써 탐색과 활용의 균형을 자연스럽게 맞출 수 있습니다.


베타 분포에서 매개변수에 1을 더해주는 이유.

1. 베타 분포의 매개변수 의미
Beta(α, β)에서:

  • α (알파): 성공 횟수 + 1
  • β (베타): 실패 횟수 + 1

여기서 "+1"을 하는 이유는 매우 중요합니다. 이를 "라플라스 스무딩" 또는 "가법적 평활화"라고 하는데, 이는 처음부터 극단적인 확률 추정을 방지하기 위함입니다.

2. 동전 A의 경우 다시 보기

  • 앞면(성공): 8번
  • 뒷면(실패): 2번

따라서:

  • α = 8 + 1 = 9 (성공 + 1)
  • β = 2 + 1 = 3 (실패 + 1)

그래서 Beta(9, 3)이 맞습니다!

3. 이해를 돕기 위한 극단적인 예시
만약 +1을 하지 않고 베타 분포를 만든다면:

동전을 1번 던져서 앞면이 나온 경우:

  • 순수 계산: Beta(1, 0)
  • 이는 "이 동전은 100% 앞면만 나온다!"라는 너무 성급한 결론
  • +1 적용: Beta(2, 1)
  • "앞면이 나올 가능성이 높지만, 더 지켜보자"라는 합리적인 추정

이렇게 베타 분포에서 매개변수에 1을 더하는 것은 섣부른 판단을 방지하고, 초기의 불확실성을 적절히 반영하기 위한 수학적 장치입니다.

profile
시리즈를 기반으로 작성하였습니다.

0개의 댓글