목표
- 데이터 분석의 시작 단계인 올바르게 문제를 정의하는 법에 대해 이해
1) 문제 정의란?
데이터 분석에 실패하는 이유
- 풀고자 하는 문제를 명확하게 정의하지 않음
- 데이터 리터러시 단원을 통해 알아낸 것: 풀고자 하는 문제를 명확하게 정의하지 않고 데이터 분석에 먼저 뛰어들어서 여러 가지 오류와 마주하게 됨 → 심슨의 역설, 시각화 왜곡, 샘플링 편향 등
문제 정의란
- 데이터 분석 프로젝트의 성공을 위한 초석
- 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
- 프로젝트의 목표를 설정하고 분석 방향을 설정
사례
- 상황: 매출 증가가 목표인 패션 플랫폼 A
- 문제 정의: 매출을 어떻게 늘릴 수 있을까?
- 문제 정의는 했지만, 모호하고 구체적이지 않음
- 어떤 고객층, 제품에 초점을 맞출지에 대한 명확한 지침이 부재
- 데이터 분석할 시 방향성을 잡기가 어려움
사례의 문제 정의 수정하기
- 상황: 패션 플랫폼 A, 매출 증가가 목표
- 문제 정의: 지난 6개월 동안 25 - 35세 여성 고객층의 구매 전환율이 급격히 감소했다. 이 고객층의 전환율을 2%에서 5%로 끌어올리기 위해 어떤 마케팅 전략을 적용할 수 있을까?
- 구매 전환율(%)
- 고객이 방문한 후 구매까지 전환됐는지의 여부
- 구매고객수/방문고객수*100
2) 예제
🧐 상황: 3개월 전부터 자사 제품의 사용자 수가 감소하고 있다. 사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만, 효과가 없어 보인다. 또한 자사 제품 내 서비스 중 A보다 B가 더 안 좋은 상황이다. 사용자가 줄었기 때문에, 수입도 감소하고 있다.
- Q. 위와 같은 상황에서 문제는 무엇일까? 정의해보자.
- A. 수입 감소, B 서비스가 더 안 좋은 상황인 이유
- 설명을 읽고 보완할 부분 생각하기
- A1. ”사용자 수가 감소하고 있다.”
- feedback: 사용자 수는 충분히 생각해볼 만한 문제이나, 결과적으로 풀고자 하는 것이 수입 감소라고 한다면, 사용자 수는 문제가 아닌 원인이 됩니다.
- A2. “이벤트 효과가 없다.”
- feedback: 이벤트 효과가 없는 것은 충분한 살펴볼 만합니다. 그러나, 이벤트가 효과적이지 않기 때문에 발생하는 문제가 근본적으로 해결되어야 하는 것일까요?
- A3. “A 서비스 보다 B 서비스가 상황이 안 좋아진 이유를 살펴보아야 한다.”
- feedback: 위 내용은 분석 과정 중 확인해 봐야 할 내용인 것 같습니다. 그러나 이것을 근본적인 문제라고 하기에는 어려워 보입니다.
- A4. “수입이 감소한 것이 문제다.”
- feedback: 궁극적인 문제의 관점에서 수입의 감소는 매우 중요한 문제라고 판단됩니다.그러나, 단어의 정의에 있어 더 명확할 필요가 있습니다. 가령 수입이 의미하는 것이 매출액인지, 순이익인지 등을 고려해야 합니다.
🡆 결과적으로 문제 정의는 더 복잡하고 시간이 소요되는 과정
🡆 항상 "문제를 올바르게 정의하였는가?"라는 물음을 가지고 임해야
3) 문제 정의 방법론
MECE (Mutually Exclusive, Collectively Exhaustive)
- 문제 해결과 분석에서 널리 사용되는 접근 방식
- 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나눔
- 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석 가능
잘못된 MECE
- 사람: 남성, 여성, 아저씨
- 영화 장르: 액션, 스릴러, 공포
- 자동차: SUV, 세단, 쿠페, 현기차
- 분류 기준이 다름 (자동차 종류 VS 브랜드)
- 3학년 3반 학급원: 영어 우수 학생, 수학 우수 학생
- 분류 기준이 불명확
- 서로 중복되고 누락된 정보가 존재
로직 트리(Logic Tree)
- MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
- 상위 문제로부터 시작하여 하위 문제로 계층적 접근
- 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음
로직트리를 활용한 문제 정의 및 구조화
상황: 3개월 전부터 자사 제품의 사용자 수가 감소하고 있다. 사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만, 효과가 없어 보인다. 또한 자사 제품 내 서비스 중 A보다 B가 더 안 좋은 상황이다. 사용자가 줄었기 때문에, 수입도 감소하고 있다.
- 수입 = 매출액으로 정의하고 구조화
- 사용자 수 감소에서 A, B 서비스를 나누어 생각
- 포인트 이벤트는 해결 방안 중 하나이고, 문제가 되는 것은 아님
- B서비스를 더 세분화해서 A서비스와 비교해서 다른 점이 무엇인지 찾아볼 수 있도록 구조화
- 로직트리는 정해진 답이 없으며, 사용자가 어떤 기준으로 나누냐에 따라 그 깊이와 넓이가 달라짐
- ‘브랜드 선호도 감소’와 같은 원인을 큰 가지에 삽입할 수도 있고, 고객 수 감소의 작은 가지로 넣어볼 수도 있음
- 인과 관계의 순서는 작은가지 → 큰 가지
예시: 살을 어떻게 뺄 것인가?
4) 로직 트리 예제
- 수익성 개선 방법에 대한 로직트리 그려보기
- 중복되지 않고, 누락이 없게끔 나누려면 어떤 기준을 세워야 할지 고민이 필요
- 수익 = 매출 - 비용 이기 때문에 큰 관점에서 매출 증대와 비용 감소로 나눠볼 수 있음
- 이후 고객 별, 액션 별로 나눌 수 있음
- 사용자 수는 충분히 생각해볼 만한 문제이나, 결과적으로 풀고자 하는 것이 수입 감소라고 한다면, 사용자 수는 문제가 아닌 원인이 됨
5) 로직트리 Cheet Sheet (참고 자료)
캡슐커피로 유명한 nescafe의 로직트리 자료
- 로직트리가 낯선 사람을 위한 참고 자료
- 산업군, 기업의 규모 등 상황에 따라 알맞게 가공하여 활용할 수 있음
- 시장 / 점유율에 따른 분류
- 개념적으로 분류
- 반대되는 말로 분류
- 세그먼트 기반 분류
앱 서비스에 적용하기 위해 변경
- 비즈니스에 따라 정의가 달라짐!
- 세그먼트 분류
- 라이트유저, 일반유저, 헤비유저 > 구매 전 고객, 재구매 고객, VIP 고객
e.g. 배달의 민족 → 고마운분, 귀한분, 더귀한분, 천생연분
- 캡슐 점유율
6) 문제정의 정리와 관련 팁
문제 정의를 하는 이유
- 풀고자 하는 것을 명확하게 정의
- 풀고자 하는 것을 해결하기 위한 데이터 분석의 방향성을 정하기 위해
- 결과를 정리하고 해석
- 더 나아지기 위한 새로운 액션 플랜을 수립
→ 문제 정의의 핵심은 So What?, Why So?: 도식화한 로직 트리가 두 법칙에 맞는지 확인해보기
- So What?
- 수집한 정보와 소재에서 '결국 어떻다는 것인지'를 알아내는 작업
- "그래서", "따라서", "이렇듯" 앞에 오는 정보나 소재에서 과제의 답변에 맞는 중요한 핵심을 추출하는 작업
- 나타난 현상을 바탕으로 과제에 비추어 말할 수 있는 내용의 핵심을 추출하는 작업
- Why So?
- 왜 그렇게 말할 수 있는지
- 구체적으로 무슨 뜻인지를 검증하고 확인하는 작업
- So What?한 요소의 타당성을 자료 전체 혹은 그룹핑한 요소로 증명할 수 있다는 사실을 검증하는 작업
문제 정의 팁
- 결과를 공유하고자 하는 사람이 누구인지 정의
- 결과를 통해 원하는 변화를 생각
- 회사 소속이라면, 경영자의 입장에서 보려고 노력
- 많은 사람들과 의견을 나눠보는 것도 방법
- 반드시 혼자서 오래 고민해보는 시간 가지기