[프로젝트 후기] 멤버십 및 RFM 분석

김주아·2024년 2월 26일
0

Project

목록 보기
1/3
post-thumbnail

1. Membership 및 RFM 개념

1-1) Membership 개념 및 중요성

멤버십 시스템은 고객 충성도를 높이고, 장기적인 고객관계를 구축하는데 중요한 역할을 합니다. 멤버십 프로그램은 고객에게 해당 사이트(/브랜드)의 충성도를 높이는 데 도움을 주며, 고객들은 이를 바탕으로 특별한 혜택과 서비스를 받게 됩니다. (e.g: 할인, 포인트 적립, 프로모션 대상선정 등)

그 중 특히 패션 e커머스의 경우 멤버십 시스템은 고객 충성도와 장기적인 관계 구축에 핵심적인 역할을 합니다. 패션 e커머스에서 멤버십 시스템은 다음과 같은 중요성을 지닙니다.

  • 등급별 혜택 제공: 멤버십 등급에 따라 다양한 혜택을 제공함으로써 고객의 충성도를 높이고, 장기적인 관계를 유지합니다. 이를 통해 고객의 재방문과 재구매를 유도하여 매출 증대에 기여합니다.
  • 고객 데이터 수집: 고객의 구매이력, 선호도, 행동 패턴등의 데이터를 수집하고 분석하여 맞춤형 마케팅 전략을 수립하여 매출 증대에 기여합니다.

1-2) RFM 개념 및 중요성

RFM 분석이란, 고객을 최근 구매 시점(Recency), 구매 빈도(Frequency), 구매 금액(Monetary)을 기반으로 세분화하는 방법입니다. RFM 분석은 고객이 얼마나 가치있는 고객인지를 평가하는데 사용됩니다.

  • Recency (최근성): 고객이 마지막으로 구매한 시점이 언제인지?
    → 최근 구매한 고객일수록 다시 구매할 가능성이 높습니다.
  • Frequency (빈도): 특정 기간 동안 고객이 얼마나 자주 구매하는지?
    → 빈번한 구매는 고객 충성도의 지표가 될 수 있습니다.
  • Monetary (금액): 고객이 소비한 총 금액이 얼마인지?
    → 구매 금액은 고객의 가치를 나타내는 지표가 될 수 있습니다.

RFM 분석을 통해 고객을 다양한 그룹으로 그룹화하고, 각 그룹에 맞는 맞춤형 전략을 수립할 수 있습니다. (e.g: 최근에 자주 높은 금액을 지출하는 고객 : 보상 제공, 오랫동안 구매를 하지않은 고객: 재방문/재구매 프로모션 제공)

이러한 고객 세분화는 마케팅의 효율성을 높이고 고객 만족도를 증가시키는데 도움을 줄 수 있습니다.

1-3) Membership 및 RFM을 함께 확인하는 이유

멤버십과 RFM 모두 고객의 행동과 고객의 가치를 이해하는데 중요한 분석방법입니다. 그렇기 때문에 이 두 방법론을 함께 사용한다면, 보다 정밀한 고객 세분화가 가능하며 이를 통해 더욱 효과적인 고객관리 및 맞춤형 마케팅 전략을 수립할 수 있습니다.

2. 진행배경

2-1) 경쟁사 레퍼런스

  • 분석하고자 하는 커머스가 패션 e커머스임을 감안하여 패션 e커머스 대표 브랜드인 ‘무신사’, ‘29CM’, ‘W컨셉’을 경쟁사로 두고 레퍼런스를 서치했습니다.
경쟁사등급점수 계산방법특이사항
무신사최근 5년간 누적 구매 금액 + 포인트등급 계산시 활동 점수(*미션 수행 및 커뮤니티 활동) 포함
29CM최근 6개월간 누적 구매 금액
W컨셉최근 6개월간 누적 구매상품건수 및 금액 기준등급 계산시 구매 상품건수 포함

1. 무신사(링크)

  • 등급 점수 계산 방법: 최근 5년간 누적 구매 금액 + 포인트

    • 누적 구매 금액
      • ‘상품 판매가-등급할인-쿠폰할인+결제 수수료’
    • 포인트
      • 오늘의 미션 수행 및 커뮤니티 활동을 통해 획득
        • 포인트를 적립금으로 전환해서 사용가능하며, 적립금 전환 시 회원등급이 낮아질 수 있음
          • 참고) 오늘의 미션
          • 참고) 무신사 커뮤니티 (링크)
  • 등급(8개)별 구간 및 혜택

2. 29cm (링크)

  • 등급 점수 계산 방법: 최근 6개월간 누적 구매 금액

    • 누적 구매 금액
      • 구매확정된 상품 판매가의 합(배송비 금액 제외)
  • 등급(4개)별 구간 및 혜택

3. W컨셉 (링크)

  • 등급 점수 계산 방법: 최근 6개월간 누적 구매 상품건수 및 금액

  • 등급(6개)별 구간 및 혜택

2-2) 고객사 현 상황

저희 회사에서 분석하고있는 e커머스 패션 플랫폼은 현재 멤버십 설계가 되어있지 않습니다. 멤버십 설계 없이 필요에 따라 프로모션을 진행하며 고객들에게 동일하게 혜택을 제공하고 있습니다.

이렇게 계속해서 멤버십 설계없이 사이트를 운영할 경우 발생할 수 있는 문제점은 다음과 같습니다.

  1. 경쟁력 악화
    • 현재 무신사, 29CM, W컨셉으로 대표되는 많은 패션 플랫폼에서 다양한 멤버십혜택을 제공하고 있습니다. 멤버십 프로그램이 없는 경우, 경쟁사 대비 경쟁력이 떨어질 수 있으며, 고객이 해당 플랫폼에 애착을 느끼지 못하고 이탈할 가능성이 증가합니다.
  2. 고객 충성도 감소
    • 멤버십 프로그램은 고객에게 특별한 혜택과 보상을 제공하여 충성도를 높여 고객과의 장기적인 관계를 구축하는 역할을 합니다. 멤버십이 없으면 고객이 플랫폼에 충성도를 느끼기 어려워 재방문율과 재구매율이 감소할 수 있으며, 이는 장기적인 비즈니스 성장에 부정적인 영향을 미칠 수 있습니다.

3. 진행과정

3-1) 주문 데이터 요청 및 검증

데이터가 고객사의 DB에 존재하기 때문에 자유로운 접근이 어려웠습니다. 따라서 RFM 분석을 시작하기앞서, 필요한 데이터를 정의하고 해당 데이터를 고객사에 요청했습니다.

그 후, 전달받은 데이터를 Amplitude(PA Tool)의 데이터와 비교하여 데이터의 정합성을 확인했습니다.

❓ PA Tool(Product Analytics tool)이란?
: 제품 분석 도구를 말하며, 제품이나 서비스의 사용자 행동 데이터를 수집, 분석하여 제품 개선,
사용자 경험 최적화, 전략 수립 등에 도움을 주는 소프트웨어를 말합니다.
  • 1차 정합성 검증 1차 정합성 검증 기준 DB데이터와 Amplitude 데이터의 유사성은 약 80%수준
  • 최종 정합성 검증 : 최종 정합성 검증 기준 DB데이터와 Amplitude 데이터의 유사성은 약 93%수준

3-2) 데이터 형식 변경: 주문 데이터 → 유저 데이터

정합성 확인을 진행한 최종 DB 데이터(주문 데이터)를 바탕으로 데이터 형식변환을 진행했습니다. RFM분석을 위해서는 고객 기준 데이터가 필요하기 때문에 user_id 기준으로 유저별 ‘Recency(최근 구매일자)’, ‘Frequency(주문빈도)’, ‘Monetary(누적 주문액)’을 계산했습니다.

3-3) EDA (유저분포 확인)

그 후, 적절한 RFM scoring 기준을 확인하기 위해 유저분포를 확인했습니다. 유저를 10%, 5%, 1% 기준으로 구분하고 항목별 분포를 확인했습니다.

3-4) 이상치 제거

EDA에서 확인한 유저별 분포를 바탕으로 이상치를 제거했습니다. 전체 유저의 40%정도가 구매 이후 5개월 이상이 경과하였고, 70%정도가 구매횟수가 1회였기 때문에 Recency(최근 구매일자)와 Frequency(주문빈도)를 이상치제거 기준으로 설정할 수 없다고 판단하였습니다. 따라서 최종 이상치 제거의 기준은 Monetary(누적 주문액)로 설정했습니다.

RFM 분석 초기에는 일반적인 이상치 제거 기준은 IQR(4분위수), 표준편차 등의 기준으로 이상치를 제거하고자 시도했으나, 해당 분석의 목적이 멤버십 설계를 고려한 RFM분석이기때문에 상위 유저가 중요하다는 점을 고려하여 이상치 제거의 기준을 ‘N만원 이상 유저’로 설정했습니다.

이상치 제거의 기준을 1) M기준 M1만원 이상, 2) M기준 M2만원 이상, 3) M기준 M3만원 이상으로 설정하고, 이상치의 갯수 및 비율을 확인했습니다.

option1. M이 M1만원 이상 유저수 n1명 (누적비율 0.17%)
option2. M이 M2만원 이상 유저수 n2명 (누적비율 0.09%)
option3. M이 M3만원 이상 유저수 n3명 (누적비율 0.05%)

해당 과정을 통해 최종적으로 이상치의 기준을 “option3”로 설정했습니다.

3-5) RFM

1. RFM Scoring

다음으로 각 R,F,M 항목별로 점수를 구해주었습니다. 점수를 산출하는 방식은 다양합니다. 해당 분석에서는 작업시간 및 편의성등의 여러 요건을 고려하여 엑셀을 통해 분석을 진행했습니다. 엑셀을 통한 RFM 산출 과정은 해당 블로그를 참고했습니다. (출처: 엑셀을 활용한 RFM 고객가치 분석방법 링크)

R과 M는 “비율(%)”을 기준으로, F는 전체 구매회원중 약 80%가 1회 구매인 것을 고려하여 “구매횟수”를 기준으로 설정했습니다.

R Score, M Score을 계산하기 위한 비율(%)기준은 다음과 같습니다. 전체를 1~5까지로 구분한 후, 분모를 1~5까지를 더한 값으로, 분자를 점수별 내림차순 기준 값(ex. 1일때 5, 2일때 4)으로 설정했습니다. 해당 방식으로 점수별 비율을 계산하면 다음과 같습니다.

Score비율참고) 비율계산누적비율설명
133.3%=5/(1+2+3+4+5)33.3%0% ~ 33.3% 구간 내 유저
226.7%=4/(1+2+3+4+5)60.0%33.3% ~ 60% 구간 내 유저
320.0%=3/(1+2+3+4+5)80.060% ~ 80% 구간 내 유저
413.3%=2/(1+2+3+4+5)93.3%80% ~ 93.3% 구간 내 유저
56.7%=1/(1+2+3+4+5)100%93.3% ~ 100% 구간 내 유저

F Score을 계산하기 위한 구매횟수 기준은 다음과 같습니다. 1,2,3,4,5회 이상으로 구분했습니다.

Score기준 (구매 횟수 기준)
11개
22개
33개
44개
55회 이상

예를 한번들어보겠습니다. 주문 데이터에 10명의 유저가 구매한 이력이 있다고 가정해봅시다.

유저최근구매일자누적 구매횟수누적 구매금액
A2023년 08월 29일180,232원
B2023년 10월 09일2150,650원
C2023년 12월 17일251,090,000원
D2023년 10월 23일170,000원
E2023년 11월 13일172,500원
F2023년 10월 02일565,000원
G2023년 11월 17일476,000원
H2023년 11월 19일369,000원
I2023년 09월 07일446,600원
J2023년 10월 19일1124,000원

앞서 이야기한 RFM scoring을 적용해보면 다음과 같이 계산됩니다.

  • R Score (비율(%) 기준)
    유저최근구매일자유저 등수R Score
    A2023년 08월 29일11
    B2023년 10월 09일42
    C2023년 12월 17일105
    D2023년 10월 23일62
    E2023년 11월 13일73
    F2023년 10월 02일31
    G2023년 11월 17일83
    H2023년 12월 03일94
    I2023년 09월 07일21
    J2023년 10월 19일52
  • F Score (구매횟수 기준)
    유저누적 구매횟수F Score
    A11
    B22
    C255
    D11
    E11
    F55
    G44
    H33
    I44
    J11
  • M Score (비율(%) 기준)
    유저누적 구매금액유저 등수M Score
    A80,232원73
    B150,650원94
    C1,090,000원105
    D70,000원42
    E72,500원52
    F65,000원21
    G76,000원62
    H69,000원31
    I46,600원11
    J124,000원83
  • 최종 RFM Score
    유저R ScoreF ScoreM ScoreRFM Score
    A113113
    B224224
    C555555
    D212212
    E312312
    F151151
    G342342
    H431431
    I141141
    J213213

2. RFM Seg 매칭

RFM 점수가 산출되었다면, 각 점수별로 유저들을 세분화(User Segmenation)하는 과정이 필요합니다. RFM 분석시 유저들을 세분화하는 여러가지 이유가 존재합니다. 먼저 유저를 세분화하므로써 각 그룹별 맞춤형 마케팅 전략을 개발하여 고객 만족도와 충성도를 향상시킬 수 있습니다. 또한 이탈 위험 고객들을 파악하고 이들에게 재활성화 캠페인을 진행하므로써 적절한 위험 관리를 할 수 있습니다.

유저 세분화 그룹은 해당 사이트를 참고했습니다. (출처: RFM Segmentation 링크) 최종적으로 도출된 점수별 유저세분화 그룹 및 각 그룹에 대한 특징은 아래와 같습니다.

ScoresSegment (영문)Segment (한글)특징Actionable Tip
555, 545, 455, 445Champions챔피언 고객최근에 구매했고, 자주 그리고 큰 금액을 소비하는 고객해당 고객들에게 적절한 보상 제공
554, 544, 454,553, 543, 533,453, 444, 433, 535, 435,355, 354, 353, 345, 344, 335Loyal충성 고객많은 금액을 소비하고, 프로모션에 잘 반응하는 고객더 높은 금액대의 제품을 구매하도록 유도
551, 552, 541, 542, 532, 531,452, 451, 442, 441, 431, 432, 423,352, 351, 342, 341, 333, 323Potential Loyalists잠재 충성 고객최근 고객이고, 많은 금액을 소비하며, 2번 이상 구매한 고객멤버십등 혜택을 제공해서 지속적인 구매 유도
512, 511, 521, 522,422, 421, 412, 411New Customers신규 고객최근에 구매했으나 자주 방문하지 않은 고객사이트에 지속적으로 방문할 만한 혜택 및 기능 제공
525, 524, 523, 515, 514, 513, 425, 424, 413, 414, 415, 315, 314, 313Promising잠재 고객최근에 구매했으나 많은 금액을 소비한 고객쿠폰 제공을 통한 재방문 유도맞춤형 추천 서비스 제공
534, 443, 434, 343, 334, 325, 324Need attention관심필요 고객최근성, 구매빈도, 구매금액이 모두 전체 유저의 평균 이상인 고객쿠폰 서비스 및 타임딜을 통한 재방문 유도
332, 322,331, 321, 312,233, 232,221, 213, 231About to sleep잠재 휴면 고객최근성, 구매빈도, 구매금액이 모두 평균 이하인 고객CRM을 통한 개인화된 마케팅 진행
215, 214,255, 254, 245, 244, 235, 234, 225, 224,135, 134, 125,155, 154, 145, 144, 115Cannot Lose Them But Losing놓치면 안될 고객매우 큰 금액을 소비하고, 매우 자주 구매했었으나 최근 오랫동안 구매하지 않은 고객CRM을 통한 개인화된 마케팅 진행*가장 많은 마케팅을 투자해야할 고객군
311,253, 252, 243, 242, 241, 251,153, 152, 143, 142, 114, 113, 133, 124At Risk이탈 우려 고객많은 금액을 소비하고, 자주 구매했었으나 최근 오랫동안 구매하지 않은 고객*놓치면 안될 고객과 유사하지만 금액대 및 빈도 값이 더 작은 고객CRM을 통한 개인화된 마케팅 진행
223, 222,132, 123, 122, 212, 211Hibernating customers휴면 고객적은 금액을 소비하고, 방문빈도가 낮으며, 오래전에 방문한 고객해당 고객군에 마케팅 비용을 과도하게 지출하지 말것
111, 112, 121, 131, 141, 151Lost Customers이탈 고객최근성, 구매빈도, 구매 금액이 모두 가장 낮은 고객(혹시나 돌아오더라도 적은 비용 지출 예상)해당 고객군에 마케팅 비용을 과도하게 지출하지 말것
No purchase history구매 이력이 없는 고객

3-6) Membership

1. 가중치 계산

RFM score를 멤버십 구간 설정에 활용하기 위해 R,F,M 각 요소별 가중치를 계산했습니다. 가중치를 계산하는 이유는 고객의 가치를 보다 정확하게 평가하기 위해서입니다. RFM의 각 요소는 고객의 충성도 및 구매 가능성을 반영합니다. 그러나 모든 요소가 모든 비즈니스에 동일한 중요도를 나타내지 않습니다.

예를 들어, 패션 커머스의 경우 트렌드가 빠르게 변함에 따라 고객의 최신 패션 트렌드에 대한 관심과 구매의사를 파악하는 것이 중요하므로 R(최근 구매일자)이 상대적으로 높은 중요도를 갖습니다. 반면 럭셔리 상품을 취급하는 커머스의 경우 고객의 구매 금액이 매우 중요하므로 M(누적 주문액)이 상대적으로 높은 중요도를 갖습니다.

엑셀을 통해 가중치를 구하는 방법으로는 크게 2가지가 있습니다. 첫째, 매출 기여효과의 합계를 통한 가중치 구하기와 둘째, 매출 기여효과와 매출액의 상관관계를 통한 가중치 구하기가 이에 해당합니다.

1.가중치1: 매출 기여효과의 합계를 통한 가중치를 구하는 방식은 구매 금액이 높을수록 더 높은 점수를 받는 방식으로, 매출액이 높을 경우, 즉 M의 점수가 높을경우 RFM 지수가 높게 나타납니다. 해당 방식은 업종 특성상 구매주기가 길거나, 구매 금액이 미치는 영향도가 큰 업종에서 유의미한 방식입니다.

2.가중치2: 매출 기여효과와 매출액의 상관관계를 통한 가중치를 구하는 방식은 각 R/F/M Class별 기여효과 수치와 매출액의 상관계수를 구하여 그 값의 비중대로 가중치를 정하는 방식으로, 1번 방식과 달리 M 이외의 R과 F의 요소도 어느정도 고려된다고 볼 수 있습니다. 해당 방식은 업종 특성상 반복 구매가 자주 일어나거나, 고객의 활동, 구매 스펙트럼이 넓은 업종에서 유의미한 방식입니다.

가중치1과 가중치2 기준 RFM항목별 가중치를 확인한 후, 최종적으로 M(누적 구매액)의 비중이 높은 가중치1을 선택했습니다.

그 후, 가중치를 통해 도출된 최종 스코어를 기준으로 최종 스코어별 비율 및 R,F,M 분포(평균,최대,최소)를 확인했습니다.

1차적으로 스코어별 분포를 확인하고, R보다는 F, R/F보다는 M의 중요도를 반영하는 방향으로 새로운 가중치를 생성했습니다. 그 후, 이를 바탕으로 도출된 스코어별 비율 및 R,F,M 분포를 재확인하는 과정을 거쳤습니다.

이러한 과정을 거쳐 최종적으로 RFM의 가중치를 0.1:0.2:0.7으로 확정하였습니다.

2. 멤버십 기준 설계

멤버십은 RFM의 score을 기준으로 구간을 설정한 후, M(누적구매액)으로 기준을 변경해주었습니다.

  • RFM score 기준 구간설명
  • M(누적구매액) 기준 구간설명

RFM score를 반영한 최종적은 멤버십 기준은 다음과 같습니다.

🪜 멤버십 기준 (*최근 6개월 1회 이상 구매 유저의 누적 구매액 기준)

· 이상치: M4만원 이상 (0.035%)

· VVIP: M3만원 이상 M4만원 미만 (1%)

· VIP: M2만원 이상 M3만원 미만 (7.4%)

· CREW: M1만원 이상 M2만원 미만 (29.3%)

· WOK: M1만원 미만 (62%)

· NEW/CHURN: 미구매

4. 결과

4.1) 멤버십 혜택 설계


매출을 증가시키기위해서는 크게 두가지 방법이 존재하는데, 주문수를 올리거나 즉, 주문빈도를 높이거나, 건단가를 높이는 방식이 이에 해당됩니다. 매출을 증가시키기 위해 각 멤버십별 유저들의 주문빈도 및 객단가를 높일 수 있도록 멤버십 설계를 바탕으로 구간별 특징을 파악하고, 멤버십 혜택을 설계했습니다.

먼저 Amplitude를 사용하여 각 구간 평균 주문수, 주문상품수, 객단가 및 건단가를 확인한 후, 이를 바탕으로 멤버십 구간별 특징을 파악했습니다.

이를 바탕으로 기존에 진행한 쿠폰 프로모션의 성과를 바탕으로 쿠폰의 효율을 예측한 후, 쿠폰 할인율에 따른 매출 증분율과 마진율을 확인하고 멤버십 구간별 쿠폰 혜택을 설계했습니다.

4.2) Membership/ RFM Dashboard


태블로(Tableau)를 통해 멤버십과 RFM 세분화를 바탕으로 대시보드를 구현했습니다.

해당 대시보드를 통해 멤버십 관련 정보(1. 멤버십 분포, 2. 월별 멤버십 비율, 3. R(최근 주문일자), 4.F(주문빈도) 5.M(누적주문액)) 및 RFM 관련 정보(6.RFM Segment 분포, 7.월별 RFM 비율)을 확인할 수 있습니다.

좌측 상단의 멤버십 버튼 클릭시 각 멤버십 단계에 해당하는 유저들이 필터링되어 표출됩니다. 이를 통해 멤버십별 분포 및 해당 멤버십에 해당하는 유저들의 RFM 세그먼트를 손쉽게 확인할 수 있습니다.

  • 멤버십 VVIP 클릭

또한 좌측 상단의 필터를 통해 각 멤버십 및 RFM 세그먼트별 회원수 및 매출액을 파악하고 이를 비교함으로써 종합적인 비즈니스 성과를 파악할 수 있습니다.

profile
정확한 분석과 설득력 있는 시각화를 통해 데이터의 가치를 극대화합니다.

1개의 댓글

comment-user-thumbnail
2024년 11월 4일

해당 데이터를 고객사에 요청했다고 하셨는데, 혹시 어떤방식으로 컨택하셨는지 알 수 있을까요?
저도 고객 데이터로 분석하고자 하는데 접근이 어렵네요ㅜㅜ

답글 달기