cookie cats csv의 카이 제곱 검증

WOOSUNGKOO·2024년 1월 26일
0
  1. 개 요

1) cookie_cats.csv 파일 구성: 5열 90,189행

2) 각 column의 내용:
userid : 게임 플레이어의 고유 아이디
version : 게임 플레이어가 gate_30 혹은 gate_40에 해당하는 지 여부
sum_gamerounds : 게임을 설치한 후 2주 동안 플레이한 횟수
retention_1 : 게임을 설치한 후 하루 뒤에 다시 접속했는 지 여부
retention_7 : 게임을 설치한 후 일주일 뒤에 다시 접속했는 지 여부

3) 구체적인 내용
Context
이 데이터 세트에는 게임의 첫 번째 게이트가 레벨 30에서 레벨 40으로 이동했을 때 어떤 일이 발생하는지 조사하기 위한 Cookie Cats의 A/B 테스트 결과가 포함되어 있습니다. 플레이어가 게임을 설치하면 Gate_30 또는 Gate_40에 무작위로 할당됩니다.

Content
우리가 가지고 있는 데이터는 AB 테스트가 실행되는 동안 게임을 설치한 90,189명의 플레이어로부터 얻은 것입니다. 변수는 다음과 같습니다.

userid: 각 플레이어를 식별하는 고유 번호입니다.
버전: 플레이어가 컨트롤 그룹(gate_30 - 레벨 30의 게이트)에 배치되었는지 아니면 이동된 게이트가 있는 그룹(gate_40 - 레벨 40의 게이트)에 배치되었는지 여부.
sum_gamerounds: 설치 후 처음 14일 동안 플레이어가 플레이한 게임 라운드 수입니다.
보유_1: 플레이어가 설치 후 1일 후에 돌아와서 플레이했습니까?
보유_7: 플레이어가 설치 후 7일 후에 돌아와서 플레이했습니까?

플레이어가 게임을 설치하면 둘 중 하나에 무작위로 할당됩니다.

감사의 말
이 데이터세트는 DataCamp에서 가져왔습니다.
쿠키캣(Cookie Cat)은 Tactile Entertainment에서 개발한 매우 인기 있는 모바일 퍼즐 게임입니다.

이 데이터 세트를 제공해 주셔서 감사합니다! 😻

데이터 셋 출처: https://www.kaggle.com/datasets/mursideyarkin/mobile-games-ab-testing-cookie-cats

요구사항
기본적인 EDA와 전처리를 진행하세요
t-test를 이용하여 gate_30 그룹과 gate_40 그룹의 플레이 라운드 수의 평균이 같은지, 다른지 검정하세요.
chi_squre test를 이용하여 version과 retention_1이 서로 독립인지 검정하세요.
chi_squre test를 이용하여 version과 retention_2이 서로 독립인지 검정하세요.
검정 결과를 해석하고, AB 테스트의 결론을 내려보세요.

** 이상치 확인

profile
Gentleman in 70s, but possible to run a full course marathon

0개의 댓글

관련 채용 정보