리텐션 (3) Range Retention

데이터리안·2021년 12월 3일
7

서비스 분석 101

목록 보기
3/5
post-thumbnail
post-custom-banner

이 글은 데이터리안 홈페이지에서도 보실 수 있습니다.


범위 리텐션(Range Retention)은 클래식 리텐션을 유연하게 확장한 개념입니다. 클래식 리텐션에서는 분석을 특정 일/주/월 단위로(이 중에서도 일 단위의 분석을 지난 문서에서 살펴봤었죠) 한정짓는 느낌이라면 범위 리텐션은 구간을 유연하게 나눈다는 점만 다릅니다. 범위를 지정하는게 특징이기 때문에 Bracket Retention이라고도 합니다.



지금까지 얘기한 리텐션 모아보기 👇



범위 리텐션 계산하기

12월 1일에 서비스에 가입한 사용자 A, B, C, D, E의 방문로그를 아래와 같이 가정합시다. 이 데이터를 3일씩 묶어서 범위 리텐션을 계산해보겠습니다.


사용자12-01
(Day 0)
12-02
(Day 1)
12-03
(Day 2)
12-04
(Day 3)
12-05
(Day 4)
12-06
(Day 5)
12-07
(Day 6)
A방문방문방문방문방문방문방문
B방문방문방문
C방문방문방문
D방문방문
E방문방문

아래의 기준으로 데이터를 묶어봅시다.

  • Day 0: 12월 1일 (최초 접속일 또는 서비스 가입일)
  • Day 1~3: 12월 2일부터 4일까지
  • Day 4~6: 12월 5일부터 7일까지

12-01
(Day 0)
12-02 ~ 12-04
(Day 1~3)
12-05 ~ 12-07
(Day 4~6)
기간 내 방문유저수533
범위 리텐션 %100%60%60%

Day 1~3 구간 동안에는 사용자 A, B, C가 방문했고 Day 4~6 기간에는 사용자 A, D, E가 방문했습니다. Day 4~6 구간보다 Day 1~3 동안에 훨씬 많은 방문이 발생했지만 이러한 특성은 데이터를 요약하면서 사라지고 두 구간 모두 범위 리텐션은 60%로 계산됩니다.

이렇게 기간을 묶어서 계산하기 때문에 범위 리텐션 계산 방식은 노이즈에 강합니다. 우연히 하루정도 접속을 안 했다고 하더라도 리텐션에 영향을 주지 않기 때문입니다. 주로 서비스 사용주기가 길거나 주기적인 서비스에서 많이 사용합니다.


다양한 리텐션 계산 방법에 따른 차이

클래식 리텐션, 롤링 리텐션, 범위 리텐션 계산 결과를 하나의 차트로 그려보겠습니다. 같은 데이터를 이용하더라도 계산 방식에 따라서 이렇게 리텐션이 달라질 수 있습니다.

사용자의 이용 패턴이 바뀐 것도 아니고, 로그의 수집 형식이 달라진 것도 아니고 계산하는 하는 방법만 달라졌는데 리텐션 값이 이렇게 다른 것을 보면서 몇 가지 주의해야 할 점을 이야기하고 싶습니다.

  1. 남과 비교를 하려면 제대로 해야 합니다. 우리 서비스는 클래식 리텐션을 계산하고 있는데 옆 회사 롤링 리텐션을 가져다가 비교하는 일은 하지 말아야 합니다.
  2. 우리 서비스에 맞는 계산 방법을 사용해야 합니다. 사용 주기가 긴 서비스인데 일 단위 클래식 리텐션을 사용한다면 쓸데없는 일희일비를 하다가 잦은 푸시, 할인 등으로 사용자들을 지치게 할 수 있습니다. 사용주기가 짧은 서비스인데 너무 넓은 범위의 리텐션을 사용하면 계산하기까지 시간이 많이 소요되고(범위만큼 데이터가 모여야 계산할 수 있기 때문입니다), 지나치게 요약된 정보를 보느라 사용자들의 이탈시기를 놓칠 수 있습니다.
  3. 형식에 얽매이지 마세요. 우리는 지금까지 세 가지 리텐션 계산 방법을 살펴봤지만, 정해진 공식은 없습니다. 이 서비스와, 서비스를 사용하는 유저를 가장 잘 이해하는건 담당자입니다. (YOU!) 세 가지 리텐션 계산 방법을 기초로 서비스와 상황과 목표에 맞게 응용해보세요.
  4. 하나만 볼 필요는 없습니다. 어떤 것이 최선일까 고민하는데 너무 많은 시간을 쏟지 마세요. 일단 가장 쉬운 방법으로 계산하고 현상을 파악하는게 중요합니다. 그렇다고 너무 많이 보지도 마세요. 숫자가 너무 많으면 그것을 다 이해하기보다는 압도되어 버립니다.

데이터리안이 만든 SQL 캠프

막간을 이용한 광고 타임

데이터리안이 드디어 캠프를 만들었습니다!

  • 2월 금요일 개강반: 2/4, 2/11, 2/18, 2/25 (총 4회) (매주 19:30 ~ 21:30, 2시간)

데이터 분석을 위한 SQL 캠프에서는 리텐션에 대해서 더 자세하게 이야기하고, SQL 쿼리로 다양한 타입의 리텐션을 직접 계산하고 분석해 볼 예정입니다. 클래식 리텐션, 롤링 리텐션, 범위 리텐션을 SQL로 한 번에 추출해보고 싶은 분들은 주목해주세요!

리텐션 계산을 위해 필요한 SQL 기능은 아래 세 가지인데요.

  1. 필요한 데이터만 필터링
  2. 테이블 피보팅
  3. 서브쿼리

이번에 여는 2022년 2월 SQL 입문 캠프에서는 1번, 2번 기능을 배우고, 나중에 열릴 심화 캠프에서 3번 기능을 마저 배운 다음 리텐션 계산을 해 볼 예정입니다. 캠프 신청 방법은 여기를 참고해주세요!

혹시 캠프 신청 기간이 지나서 이 글을 발견하셨다면 datarian2020@gmail.com으로 문의메일 남겨주세요 :D



참고자료

profile
[데이터 분석, 데이터리안과 시작하세요] 데이터리안 공식 velog
post-custom-banner

0개의 댓글