# thompson sampling

3개의 포스트
post-thumbnail

Everything about Reinforcement learning#3

<span style='background-color: =톰슨 샘플링이란, 도출된 베타 분포에서 RV(e-commerce에서는 일반적으로 전환율)를 샘플링하는 기법을 말합니다. 구조를 보면 이해가 더 잘 될수있다.1.베타 분포 공간에 각 배너의 확률밀도함수(PMF

2022년 5월 20일
·
0개의 댓글
·
post-thumbnail

[Boostcamp AI Tech] Bandit for Recommendation

[Boostcamp AI Tech] Bandit for Recommendation

2022년 3월 18일
·
0개의 댓글
·

MAB(Multi-armed Bandit)

MAB와 관련된 베타 분포, 톰슨 샘플링, 베이지안 확률에 대해서 정리합니다.

2020년 5월 17일
·
1개의 댓글
·