[데이터 분석] AB 테스트

김죠·2023년 12월 18일
0
post-thumbnail

데이터 분석이 왜 필요할까?

  • 우리가 하고자 하는 바에 대한 명확한 근거를 줄 수 있다!
  • 데이터를 이용하여 문제를 파악하고 행동을 결정한다

데이터 분석의 기본 구조

  1. 문제 정의 및 가설 설정하기
  2. 데이터 분석 기본 세팅 하기
  3. 데이터 분석하기
  4. 분석 결과 시각화 하기
  5. 최종 결론 내리기

좋은 가설이란?

  1. 풀고자 하는 문제의 방향과 일치하는 가설 -> 풀고자 하는 문제에 대해 명확히 알 것!
  2. 테스트 가능한 가설 -> 데이터로 확인할 수 있는 가설을 세울 것!
  3. 액션으로 이어질 수 있는 가설 -> 가설 검증 결과에 따라 특정 액션으로 유도 가능해야 함!

AB 테스트

  • 주로 웹사이트 마케팅에서 많이 쓰이는 테스트 방법, 디자인, 인터페이스, 상품 배치, 모바일앱, 게임 등에서도 활용되는 방법
  • 두 집단의 처리를 다르게 한 후 비교를 통해 더 높은 성과를 보이는 처리 방법을 선정하는 방법
  • 두 사건의 상관관계를 통해 두 집단의 인과관계(의 가능성이 높은 것)를 파악하기 위해 사용

Q. 스파르타코딩클럽 수강생들의 완주율이 8월 중순부터 크게 떨어진 이유는?

1. 스파르타코딩클럽 현황

1) 스파르타코딩클럽은 "찐한관리"로 수강생의 동기부여를 일으켜 수강생들의 꾸준한 수강을 돕고 있음
2) 최근 3개월간 찐한관리 신청 비율과 완주율 모두 감소하고 있음

2. 가설 수립

찐한관리를 받은 인원의 완주율이 받지 않은 인원보다 높을 것이다.

import pandas as pd
sparta_data = pd.read_csv("sprata_data.csv")
sparta_data.head()

  • managed : 찐한관리 신청 유무(True / False)
  • progress_rate : 수업 진도율
sparta_data.groupby('managed')['progress_rate'].mean()

  • "찐한관리"를 받은 수강생들의 평균 수업 진도율은 약 68.5%
  • "찐한관리"를 받지 않은 수강생들의 평균 수업 진도율은 약 38.5%
    => 찐한관리를 받은 수강생들의 완주율이 더 높음!
    => 찐한관리의 신청 비율을 높이면 수강생들의 완주율 개선에 기여할 수 있을 것으로 보임
profile
1=850

0개의 댓글