

목 차
1. RFM의 개념
2. RFM 분석 프로세스
3. RFM 분석 활용.
4. RFM 적용 시 고려할 점.
5. RFM 분석의 장단점.
6. 추천 학습 루트.

RFM은 고객 세분화의 척도인 "CLV : 고객 생애 가치"를 예측하는 가장 효율적인 휴리스틱(Heuristic) 방법론입니다.
3가지 지표(R,F,M)는 상호 보완적으로 고객의 행동을 정의합니다.
RFM 분석에서는 '회사 매출에 가장 중요한 요인은 최근성(Recency), 행동 빈도(Frequency), 구매금액(Monetary)이다' 라는 가정을 두고 있으며, 이 3가지 관점에서 고객의 가치를 분석.
즉, 사용자별로 이 3가지 관점에서 (얼마나 최근에, 얼마나 자주, 얼마나 많은 금액을 지출했는지) 에서
1) 사용자들의 분포를 확인 하거나 2) 사용자 그룹이나 등급을 나누어 분류(Segmentation) 하는 분석 기법
정리 :
RFM은 고객의 과거 구매 행동을 기반으로 고객 가치를 평가하고 세분화하는 분석 기법.

고객의 활성도 척도. 최근 구매 고객일수록
마케팅 메시지에 대한 반응률(Response Rate)과 재구매 가능성이 높음.
이탈 방지 전략의 핵심 지표

기준일(오늘)로부터 마지막 구매일까지의 경과 일수를 계산하는 지표.
주로 SQL의 DATEDIFF()나 Python의 datetime 연산을 사용.
값이 작을수록 좋습니다.
특정 기간 내의 순 주문(결제 완료) 건수를 COUNT() 집계 함수로 계산.
기간 설정이 데이터 모델링의 중요한 요소.
특정 기간 내의 실 결제 금액(환불/취소 제외)을 SUM() 집계 함수로 계산.
데이터 정제 과정에서 할인, 쿠폰 적용 여부를 명확히 해야함.

고객의 상태 변화(Transition)를 예측하는 데 가장 중요한 Feature.
R 값이 높아지면(구매가 오래될수록) 이탈 확률이 급격히 증가.





'R 점수' 가 급격히 낮아지는 고객(Hibernation/At Risk)을 실시간으로 감지하고,
이들에게 {Push 알림, 이메일, 광고 리타겟팅} 등의 채널을 통해
맞춤형 오퍼를 제공하여 이탈을 방지.








신입 마케터/데이터 엔지니어로서 RFM 분석을 마스터하기 위한 체계적인 학습 로드맵입니다. CRM/그로스 마케팅과 데이터/ML 엔지니어링 관점을 모두 담아 실무에 바로 적용할 수 있도록 구성했습니다.
| 단계 | 학습 주제 | 도구/자료 | 학습 목표 및 관점 |
|---|---|---|---|
| 1 | RFM 개념 & CRM 전략 이해 | HubSpot, Salesforce, 국내/외 마케팅 CRM 블로그 | [CRM/그로스 마케팅] RFM 지표별 고객 세그먼트의 특징(예: 555 vs 511)을 이해하고, 각 세그먼트별로 어떤 마케팅 메시지(캠페인)가 효과적인지 파악합니다. |
| 2 | SQL 기반 RFM 지표 집계 실습 | MySQL / PostgreSQL, 실제 또는 가상의 거래 데이터셋 | [데이터 엔지니어] MAX(), COUNT(), SUM(), DATEDIFF() 등 SQL 함수를 사용하여 R, F, M 3가지 핵심 지표를 직접 추출하고 집계하는 쿼리를 작성합니다. 데이터의 흐름을 이해하는 기본 단계입니다. |
| 3 | Python pandas로 RFM 분석 자동화 | Python, pandas, matplotlib | [데이터 엔지니어/ML 엔지니어] SQL로 추출한 데이터를 pandas DataFrame에 로드하고, 분위수(Quantile) 기반으로 R, F, M 점수를 부여하며, 고객 세그먼트를 분류하는 스크립트를 작성하여 분석 과정을 자동화합니다. |
| 4 | RFM → K-means 클러스터링 확장 | Python, scikit-learn | [ML 엔지니어] 전통적인 분위수 기반 점수 부여 방식의 한계를 벗어나, K-means와 같은 비지도 학습 알고리즘을 적용하여 데이터가 스스로 고객 군집을 형성하도록 모델링하고 결과를 해석합니다. |
| 5 | RFM 기반 이탈 예측 모델 구축 | Python, Logistic Regression / XGBoost | [ML 엔지니어] R, F, M 지표를 특징(Feature)으로 사용하여 고객의 이탈 여부(Churn)를 예측하는 지도 학습 모델을 개발합니다. 이로써 RFM이 단순 분석을 넘어 예측 모델의 핵심 피처임을 이해합니다. |
| 6 | Airflow 기반 자동화 파이프라인 구축 | Apache Airflow, dbt (Data Build Tool) | [데이터 엔지니어] 매일 또는 매주 RFM 지표를 계산하고, 고객 세그먼트를 분류하며, 이탈 예측 모델을 실행하여 결과를 CRM 시스템으로 전달하는 종단 간(End-to-End) 데이터 파이프라인을 자동화합니다. |
