[Data] 분석 프레임

Ik·2022년 7월 25일
0

Data

목록 보기
21/34

분석 프레임

  • 퍼널 분석
    • 어느 단계에 집중해서 개선해야할까
    • 목표, 경로(PATH)
      • 고객 여정
        • 사용자가 우리가 원하는 행동을 하기까지의 경로
    • 고객 여정을 따라가며 단계적으로 분석하는 것
      • 목표까지의 고객 여정을 단계별로 나눠 단계별 전환과 이탈을 측정하는 분석
      • ex) 이커머스 : 구매 전환
        • 메인페이지 - 상품 상세페이지 - 장바구니 담기 - 결제 - 결제완료 과정에서 어떤 과정에 집중을 해야 구매자들의 소비를 이끌어 낼까가 포인트
    • 특정 기능을 잡아 목표로 삼을 수도 있다
    • 장점
      • 어디가 문제인지, 어디에 집중해서 우리 서비스를 개선해야하는지 알 수 있다
      • 그룹별 퍼널 비교를 통해 우수한 퍼널을 보이는 그룹을 찾고 이에 맞는 액션이 가능
        • 성별과 같은 특정 기준으로 그룹을 나눠 비교
        • 경로를 조금 더 쪼개 보며 문제 파악
      • 퍼널에서 이탈하는 고객들의 이후 행동을 통해 개선 포인트 도출
    • 과정
      • 최종 목표, 비즈니스에서 가장 중요한 메트릭 정의하기
        • 메트릭 - 측정에 사용된 측정 척도 및 기법
          • ex) 주기로 척도를 잡았을 때, 하루가 될지 일주일이 될지 등 
      • 목표까지의 단계, 시나리오 만들어보기
        • 고객 여정이 선형적이지 않아 실무에서 많은 어려움 존재
      • 전환율 기준 정하기
        • 퍼널의 단계별 전환에 대한 기간 기준
          • ex) 장바구니에서 구매를 하는데 몇일이 걸렸는지
          • 카운트 기준 : 클릭수 VS unique 유저수
            • 한 사람이 3개를 산 경우 한사람이라 1이 카운트인지, 3을 카운트 해야하는지
      • 전환율 데이터 산출하기(가설에 따라 세그먼트로 나눠서 비교하기)
        • 기간, 유저속성, 유입경로 등을 기준으로 퍼널을 다시 쪼갬
      • A/B테스트로 지표 개선해가기
        • 전환율이 문제가 있는 단계에서 실험을 통해 지표를 개선해 나가는 것
        • A/B테스트
          • A안, B안 두고 계속해서 비교해 테스트 하는 것
          • 즉각적 개선 효과를 기대하기 보다는 지속적인 문제 개선이 필요
    • 깔때기 형태라 봤을 때 좁은 부분(=출구 단계)의 전환율 문제에 집중하는 것이 효과적
      • 목표 지점에서 먼 소비자들 보다는 가까이 온 소비자에게 집중하는 것
        • ex) 홈페이지를 스쳐 방문하는 소비자들보다 장바구니에 담아 구매 직전까지 온 소비자들에게 집중
      • [##Image|kage@bFAJmt/btrtgrbWMZL/txJxdha3hSPkQCz6GivccK/img.jpg|CDM|1.3|{"originWidth":966,"originHeight":886,"style":"alignCenter","width":306,"height":281}##]
  • 코호트 분석
    • 시간이 흐르면서 고객은 어떻게 바뀌고 있는지
    • 고객을 서로 다른 그룹으로 나눠 시간에 따라 지표의 변화를 측정
    • 종류
      • Time 코호트
        • 제품이나 서비스를 사용한 시기에 따라 고객을 그룹화
          • ex)(1월, 2월 가입자), (1월, 2월 구매자) 등
          • 주기를 잡는 것이 중요
            • daily, time, monthly, weekly 등
            • 참고 ) 쿼리 이용해 주기를 다룰 때 DATE_TRUNC 이용
              • DATE_TRUNC - 지정한 기준에 따라 날짜를 잘라주는 함수
          • cohort : 앱을 설치한 일자
          • Day 0~10 : 앱을 설치하고 얼마나 지났는지
          • 각 셀에 지표 들어감
            • 지표(메트릭) : 액티브 유저의 리텐션
          • 표의 가로 : 리텐션 over 유저의 라이프타임
          • 표의 세로 : 리텐션 over 프로덕트 라이프사이클
      • Behavior 코호트
      • Size 코호트
  • 리텐션의 종류
    • 리텐션
      • 기존 고객 유지가 핵심
      • 산출 방법
        • 클래식 리텐션 = Day N 리텐션
          • N일 뒤에 다시 돌아온 유저의 비율
          • (D+N일 뒤에 방문한 사람 수) / (D0에 방문한 사람 수)
          • 장점
            • 개념이 간단하기 때문에 계산하기 쉽고 설명하기 쉽다
          • 단점
            • 일별 이벤트에 영향 많이 받는다
            • 특정 일에 방문 수 많다면 혼동 발생
            • N일이 아닌 경우에 방문이 기록인 안됨
        • Range 리텐션
          • 다음 Period에 다시 돌아온 유저의 비율
          • 일반적인 기준은 주 혹은 월 단위
            • period를 비즈니스에 맞게 정하는 것이 중요
          • (next period에 방문한 사람 수)/(최초 period에 방문한 사람 수)
          • 장점
            • 개념이 간단하기 때문에 설명하기 쉽다
            • 특정 일 이벤트에 대해 덜 민감
          • 단점
            • period 기간만큼 시간이 지나야 지표를 확인할 수 있다
        • 롱링 리텐션
          • 일정 기간 이후에 리턴한 유저의 비율
          • 긴 관계를 유지하는 유저의 수를 판단하는데 적합한 지표 
          • (N일 이후 방문한 사람 수)/(D0에 방문한 사람 수)
          • 장점
            • 이탈에 대한 정보를 얻을 수 있다(100% - 이탈율)
            • 계산이 빠르다(첫번째 방문일자, 마지막 방문일자로만 계산)
          • 단점
            • 충성고객과 N일 이후 한번만 온 사람을 같게 취급
            • 시간이 지나면서 숫자가 바뀔 수 있다
          • 코드 예
            • SELECT COUNT(customer_id) AS total_customer,
                  COUNT(CASE WHEN diff_day>=29 THEN 1 END) AS retention_customer,   -- 30일 주기, ELSE 안쓴 경우 NULL로 RETURN
                  COUNT(CASE WHEN diff_day>=29 THEN 1 END) / COUNT(customer_id) AS rolling_retention_30   --retention비율
              FROM(
              SELECT customer_id, DATE(MIN(invoice_date)) AS first_purchase, 
                  DATE(MAX(invoice_date)) AS recent_purchase, 
                  DATE_DIFF(DATE(MAX(invoice_date)),DATE(MIN(invoice_date)),DAY) AS diff_day 
              
              FROM data.sales
              GROUP BY customer_id
              )
        • 리텐션을 계산하는 다양한 공식
      • RFM 분석
        • 고객 행동에 기반한 Segmentation 방법
        • 굉장히 직관직이고 심플
          • 같은 그룹으로 묶이는 기준이 명확하게 보인다
        • 고객 케어
          • 고객 개인화 관리 불가
          • 고객을 특정 기준을 두고 묶어
            • recency - 얼마나 최근에 구매했는지
            • frequency - 얼마나 자주 구매했는지
            • monetary - 얼마나 많은 금액을 구매했는지
        • 분석과정
          • 고객별로 R/F/M 수치 산출
          • R/F/M 각각에 대해 등급 만들어주기
            • 등급을 기반으로 여러 그룹으로 나눔
              • F, M가 클수록 높은 점수
              • R 작을수록 높은 점수
              • 등급 나누는 기준
                • 보통 파레토 법칙 이용
                • 파레토 법칙
                  • 전체 매출의 80%가 20%의 고객에서 발생에 근거한다는 것
                • 도메인에 맞게 자체 기준
                  • 비즈니스와 관련해 결정
                • 5개 이상 그룹은 지양하는 것이 좋음
                • 매출(=M)이 없는 경우
                  • M 대신 인게이지먼트(engagement) 지표 활용
                  • R과 F만 사용해도 유의미
          • RFM 그룹과 RFM 점수 산출
            • RFM 점수
              • Recency 점수 + Frequency 점수 + Monetary 점수 
                • 비지니스 특성에 따라 중요한 특성에 더 큰 가중치 줘서 계산
              • 클수록 좋음
              • 그룹과 점수를 가지고 커스텀 그룹을 만들 수 있지만 이 경우에 고객의 RFM 정보 희석될 수 있음
          • 커뮤니케이션 그룹과 그룹에 맞는 메시지 정하기
            • RFM그룹 
              • VVIP
                • 가장 자주, 큰 금액, 가장 최근
              • 중요 신규 고객
                • 회수는 적지만, 큰 금액
                • VIP가 될 가능성이 높은 고객
              • LOW-SPENDING 충성고객
                • 자주, 적은 금액, 최근
                • spend-level 높일 필요
              • 이탈한 충성고객
                • 자주, 많은 금액
                • 다시 데려오는 시도를 해볼만한 고객

0개의 댓글