본 내용은 데이터리안 'SQL 데이터 분석 캠프 실전반' 을 수강하며 작성한 내용입니다.
AARRR 프레임 워크를 만든 데이브 맥클루어는, 스타트업에게 우선 리텐션(Retention)에 집중할 것을 권장합니다. 리텐션이란 무엇일까요?
리텐션은 간단히 말해서, 우리 서비스를 사용한 이용자들이 계속 우리 서비스를 사용하는지를 확인하는 것입니다. 어떠한 지표를 리텐션으로 정할지 (ex. 방문, 구매 등), 얼마 동안 이용을 안했을 때 이탈로 볼 것인지는 비즈니스마다 천차만별이죠.
데이터리안 SQL 데이터 분석 캠프 실전반에서는 리텐션을 분석하기 위한 방법들을 소개해줍니다. 수업 자료를 모두 공유하기는 어렵지만, 아래의 링크만 확인을 해도 큰 도움이 될 것 같네요.
리텐션 (1) Classic Retention
리텐션 (2) Rolling Retention
리텐션 (3) Range Retention
리텐션 (4) Stickiness
리텐션 (5) 리텐션 차트, 리텐션 커브
리텐션 분석 실습을 하기 위해 Northwind Database는 Northwind라는 가상의 식품회사에 대한 샘플 데이터를 활용했습니다.
데이터 기간은 2006년 1월부터 ~ 2006년 6월까지입니다. 해당 데이터를 활용하여 고객별 첫 구매일과, 마지막 구매일을 구했습니다. 이제 이 데이터를 활용하여 리텐션 분석을 해보도록 하겠습니다.
클래식 리텐션을 구할 때 필요한 컬럼은 first_order_month
와 order_month
입니다. 해당월에 첫 구매를 한 고객이 다른 월에 구매를 했는지 살펴보는 방식으로 분석을 했습니다.
분석의 결과는 다음과 같습니다. 분석의 결과를 표기하는 방법은 다양한데요. 가장 많이 사용되는 방법이 가장 아래의 표라고 합니다. 첫 달 구매를 얼마나 했는지는 수치로 확인하고, 그 이후의 데이터는 비율(%)로 확인할 수 있게끔 처리하였습니다.
표를 보시면 1월에 첫 구매를 한 고객님들이 이후에도 꾸준히 우리 서비스에 남아 있다는 것을 확인해 볼 수 있습니다.
다음으로 롤링 리텐션입니다. 롤링 리텐션에서는 first_order_month
와 last_order_month
를 활용했습니다. 마지막 구매달 이전이라면 아무리 중간에 구매를 하지 않았더라도, 이탈로 처리하지 않는다는 것이 롤링 리텐션의 특징입니다.
그래서 클래식 리텐션 분석과 롤링 리텐션의 분석의 결과에는 차이가 있습니다. 이 차이가 크다면, 고객들의 구매 주기가 긴 플랫폼이라고 해석할 수 있겠죠.
롤링 리텐션 분석의 결과를 보면, 클래식 리텐션의 결과와 마찬가지로 1월 첫 구매를 한 고객들이 이탈을 하지 않고 구매를 꾸준히 하고 있다는 것을 알 수 있습니다. 이제 이 원인을 분석하고 액션 플랜을 제시하는 것이 중요합니다.
도대체 왜 1월 첫 구매 고객들이 리텐션이 높은 이유는 무엇일까요? 이를 알아내기 위해서는, 해당 고객군의 인구통계학적 특징을 살펴보거나, 어떤 유입 경로로 들어왔는지, 어떤 기능을 경험했는지 등을 확인해 볼 수 있습니다. 이유를 찾았다면, 액션 플랜을 제안에는 훨씬 힘이 실릴 것입니다.