아티클 스터디
머신러닝 심화 군집화까지 수강 완료
머신러닝 특강 - 분류
[ML] 의사결정 나무 Decision Tree
[ML] 랜덤 포레스트 Random Forest
[ML] knn | k nearest neighbor
[ML] 부스팅 알고리즘 | 전체 실습
[ML] K-means clustering | 엘보우 기법 | 실루엣 계수
A와 B 사이의 차이가 어느 정도 되기를 기대하느냐에 따라 매번 다르다!
why? 동일한 신뢰수준이라도 표본의 크기에 따라 유의미한 결과 여부가 달라질 가능성이 있기 때문
- 원래 기존 방안(A안)의 고객 전환율이 20%일 때,
- 대인(B안)이 1%밖에 차이가 나지 않아도 결과가 유의미하려면 각 그룹당 표본이 최소 25,555명 필요
- 반면 대안(B안)이 5% 차이가 난다면 표본이 1,030명이라도 유의미한 결과를 얻을 수 있다.
즉, 두 방안의 결과가 몇 %정도 차이 날 것이라고 기대하는가? 와 같은 질문.
A/B테스트를 기획하고 설계한 담당자가 추측과 이전의 경험을 바탕으로 결정하는 수밖에 없다.
- 표본이 많을수록 A안과 B안의 결과 차이가 작더라도 실험 결과가 통계적으로는 유의미할 수 있다
- 표본이 작더라도 A안과 B안의 결과 차이가 크면 마찬가지로 통계적으로 유의미할 수 있다
원래 목표인 ‘더 좋은 방안 제공’은 뒷전 + 비즈니스 리소스의 효율적 활용 실패
단순한 비교가 아니라 고객에게 정말로, 확실하게, 유의미하게, 더 나은 방안을 제공하고 이를 통해 서비스의 지표를 개선하고 싶다면, 우리의 진짜 질문과 이를 제대로 구현하고 이해하기 위한 통계 지식, 그리고 이를 바탕으로 한 몇 가지의 주의사항 숙지는 필수!