이중차분법

HanJu Han·2024년 7월 28일

A/B Test

목록 보기

1/1

A/B 테스트는 두 가지 버전(A와 B)을 비교하여 어떤 것이 더 효과적인지 판단하는 실험 방법입니다. 주로 웹사이트, 앱, 마케팅 캠페인 등에서 사용됩니다.

이중차분법은 정책이나 개입의 효과를 측정하는 데 사용되는 통계적 기법입니다. 처치군(treatment group)과 대조군(control group)의 시간에 따른 변화를 비교합니다.

이중차분법의 장점
1. 시간에 따른 자연적 변화를 고려
2. 그룹 간 초기 차이를 통제
3. 외부 요인의 영향을 최소화

이중차분법을 활용한 A/B 테스트는 단순 비교보다 더 정확한 결과를 제공할 수 있습니다. 시간에 따른 변화와 그룹 간 차이를 동시에 고려하기 때문입니다.

온라인 쇼핑몰에서 새로운 추천 시스템을 도입한 경우를 가정해 보겠습니다.

시나리오:

데이터:

그룹	처치 전 평균 주문액	처치 후 평균 주문액
대조군(A)	$52	$55
처치군(B)	$51	$58

단계별 분석:

각 그룹의 변화 계산:
- 대조군(A) 변화: $55 - $52 = $3
- 처치군(B) 변화: $58 - $51 = $7
이중차분 계산:
처치 효과 = (처치군 변화) - (대조군 변화)
= $7 - $3 = $4
결과 해석:
새로운 추천 시스템(B)은 기존 시스템(A)에 비해 평균 주문 금액을 $4 증가시켰습니다.
통계적 유의성 검정:
(이 예제에서는 실제 검정을 수행하지 않았지만, 실무에서는 t-검정이나 회귀 분석 등을 통해 결과의 통계적 유의성을 확인해야 합니다.)
시각화:

주문액($)
  |
60|                 B(58)
  |              /
55|  --
     A(55)
  | --      /
50| A(52) B(51)
  |
--+------------------
  처치 전    처치 후

이 그래프는 처치군(B)의 증가가 대조군(A)보다 더 급격함을 보여줍니다.

추가 고려사항:
- 평행 추세 가정: 처치 전 기간 동안 두 그룹의 추세가 유사한지 확인
- 외부 요인: 이 기간 동안 주문 금액에 영향을 줄 수 있는 다른 요인(예: 계절성, 프로모션 등)이 없었는지 확인
- 장기 효과: 2주 후의 결과가 지속되는지 추가 모니터링 필요

이 예제는 새로운 추천 시스템이 평균 주문 금액을 증가시키는 데 효과가 있음을 보여줍니다. 하지만 실제 비즈니스 결정을 내리기 전에는 통계적 유의성, 비용 대비 효과, 고객 만족도 등 다양한 요소를 종합적으로 고려해야 합니다.

ref: https://www.youtube.com/watch?v=K6tcSw-JCL8

시리즈를 기반으로 작성하였습니다.