02. 문제 정의

Suhyeon Lee·2024년 10월 15일
0

목표

  • 데이터 분석의 시작 단계인 올바르게 문제를 정의하는 법에 대해 이해

1) 문제 정의란?

  • 성공적인 데이터 프로젝트를 위한 기초 단계

데이터 분석에 실패하는 이유

  • 풀고자 하는 문제를 명확하게 정의하지 않음
    • 데이터 리터러시 단원을 통해 알아낸 것: 풀고자 하는 문제를 명확하게 정의하지 않고 데이터 분석에 먼저 뛰어들어서 여러 가지 오류와 마주하게 됨 → 심슨의 역설, 시각화 왜곡, 샘플링 편향 등

문제 정의란

  • 데이터 분석 프로젝트의 성공을 위한 초석
  • 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
  • 프로젝트의 목표를 설정하고 분석 방향을 설정

사례

  • 상황: 매출 증가가 목표인 패션 플랫폼 A
  • 문제 정의: 매출을 어떻게 늘릴 수 있을까?
    • 문제 정의는 했지만, 모호하고 구체적이지 않음
      • 너무 지엽적임
    • 어떤 고객층, 제품에 초점을 맞출지에 대한 명확한 지침이 부재
    • 데이터 분석할 시 방향성을 잡기가 어려움

사례의 문제 정의 수정하기

  • 상황: 패션 플랫폼 A, 매출 증가가 목표
  • 문제 정의: 지난 6개월 동안 25 - 35세 여성 고객층의 구매 전환율이 급격히 감소했다. 이 고객층의 전환율을 2%에서 5%로 끌어올리기 위해 어떤 마케팅 전략을 적용할 수 있을까?
    • 구매 전환율(%)
      • 고객이 방문한 후 구매까지 전환됐는지의 여부
      • 구매고객수/방문고객수*100

2) 예제

🧐 상황: 3개월 전부터 자사 제품의 사용자 수가 감소하고 있다. 사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만, 효과가 없어 보인다. 또한 자사 제품 내 서비스 중 A보다 B가 더 안 좋은 상황이다. 사용자가 줄었기 때문에, 수입도 감소하고 있다.

  • Q. 위와 같은 상황에서 문제는 무엇일까? 정의해보자.
    • A. 수입 감소, B 서비스가 더 안 좋은 상황인 이유
  • 설명을 읽고 보완할 부분 생각하기
    • A1. ”사용자 수가 감소하고 있다.”
      • feedback: 사용자 수는 충분히 생각해볼 만한 문제이나, 결과적으로 풀고자 하는 것이 수입 감소라고 한다면, 사용자 수는 문제가 아닌 원인이 됩니다.
    • A2. “이벤트 효과가 없다.”
      • feedback: 이벤트 효과가 없는 것은 충분한 살펴볼 만합니다. 그러나, 이벤트가 효과적이지 않기 때문에 발생하는 문제가 근본적으로 해결되어야 하는 것일까요?
    • A3. “A 서비스 보다 B 서비스가 상황이 안 좋아진 이유를 살펴보아야 한다.”
      • feedback: 위 내용은 분석 과정 중 확인해 봐야 할 내용인 것 같습니다. 그러나 이것을 근본적인 문제라고 하기에는 어려워 보입니다.
    • A4. “수입이 감소한 것이 문제다.”
      • feedback: 궁극적인 문제의 관점에서 수입의 감소는 매우 중요한 문제라고 판단됩니다.그러나, 단어의 정의에 있어 더 명확할 필요가 있습니다. 가령 수입이 의미하는 것이 매출액인지, 순이익인지 등을 고려해야 합니다.

🡆 결과적으로 문제 정의는 더 복잡하고 시간이 소요되는 과정
🡆 항상 "문제를 올바르게 정의하였는가?"라는 물음을 가지고 임해야

3) 문제 정의 방법론

MECE (Mutually Exclusive, Collectively Exhaustive)

  • 문제 해결과 분석에서 널리 사용되는 접근 방식
  • 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나눔
  • 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석 가능

잘못된 MECE

  • 사람: 남성, 여성, 아저씨
    • 남성과 아저씨가 중복
  • 영화 장르: 액션, 스릴러, 공포
    • 멜로, 코메디 등 누락 장르 존재
  • 자동차: SUV, 세단, 쿠페, 현기차
    • 분류 기준이 다름 (자동차 종류 VS 브랜드)
  • 3학년 3반 학급원: 영어 우수 학생, 수학 우수 학생
    • 분류 기준이 불명확
    • 서로 중복되고 누락된 정보가 존재

로직 트리(Logic Tree)

  • MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
  • 상위 문제로부터 시작하여 하위 문제로 계층적 접근
  • 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음

로직트리를 활용한 문제 정의 및 구조화

상황: 3개월 전부터 자사 제품의 사용자 수가 감소하고 있다. 사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만, 효과가 없어 보인다. 또한 자사 제품 내 서비스 중 A보다 B가 더 안 좋은 상황이다. 사용자가 줄었기 때문에, 수입도 감소하고 있다.

  • 수입 = 매출액으로 정의하고 구조화
  • 사용자 수 감소에서 A, B 서비스를 나누어 생각
  • 포인트 이벤트는 해결 방안 중 하나이고, 문제가 되는 것은 아님
  • B서비스를 더 세분화해서 A서비스와 비교해서 다른 점이 무엇인지 찾아볼 수 있도록 구조화
  • 로직트리는 정해진 답이 없으며, 사용자가 어떤 기준으로 나누냐에 따라 그 깊이와 넓이가 달라짐
    • ‘브랜드 선호도 감소’와 같은 원인을 큰 가지에 삽입할 수도 있고, 고객 수 감소의 작은 가지로 넣어볼 수도 있음
  • 인과 관계의 순서는 작은가지 → 큰 가지

예시: 살을 어떻게 뺄 것인가?

4) 로직 트리 예제

  • 수익성 개선 방법에 대한 로직트리 그려보기
    • 중복되지 않고, 누락이 없게끔 나누려면 어떤 기준을 세워야 할지 고민이 필요
  • 수익 = 매출 - 비용 이기 때문에 큰 관점에서 매출 증대와 비용 감소로 나눠볼 수 있음
  • 이후 고객 별, 액션 별로 나눌 수 있음
  • 사용자 수는 충분히 생각해볼 만한 문제이나, 결과적으로 풀고자 하는 것이 수입 감소라고 한다면, 사용자 수는 문제가 아닌 원인이 됨

5) 로직트리 Cheet Sheet (참고 자료)

캡슐커피로 유명한 nescafe의 로직트리 자료

  • 로직트리가 낯선 사람을 위한 참고 자료
  • 산업군, 기업의 규모 등 상황에 따라 알맞게 가공하여 활용할 수 있음
  • 시장 / 점유율에 따른 분류
  • 개념적으로 분류
  • 반대되는 말로 분류
  • 세그먼트 기반 분류

앱 서비스에 적용하기 위해 변경

  • 비즈니스에 따라 정의가 달라짐!
    • 세그먼트 분류
      • 라이트유저, 일반유저, 헤비유저 > 구매 전 고객, 재구매 고객, VIP 고객
        e.g. 배달의 민족 → 고마운분, 귀한분, 더귀한분, 천생연분
    • 캡슐 점유율
      • 해당 서비스 시장 점유율로 변화

6) 문제정의 정리와 관련 팁

문제 정의를 하는 이유

  • 풀고자 하는 것을 명확하게 정의
  • 풀고자 하는 것을 해결하기 위한 데이터 분석의 방향성을 정하기 위해
  • 결과를 정리하고 해석
  • 더 나아지기 위한 새로운 액션 플랜을 수립
    → 문제 정의의 핵심은 So What?, Why So?: 도식화한 로직 트리가 두 법칙에 맞는지 확인해보기
  1. So What?
  • 수집한 정보와 소재에서 '결국 어떻다는 것인지'를 알아내는 작업
  • "그래서", "따라서", "이렇듯" 앞에 오는 정보나 소재에서 과제의 답변에 맞는 중요한 핵심을 추출하는 작업
  • 나타난 현상을 바탕으로 과제에 비추어 말할 수 있는 내용의 핵심을 추출하는 작업
  1. Why So?
  • 왜 그렇게 말할 수 있는지
  • 구체적으로 무슨 뜻인지를 검증하고 확인하는 작업
  • So What?한 요소의 타당성을 자료 전체 혹은 그룹핑한 요소로 증명할 수 있다는 사실을 검증하는 작업

문제 정의 팁

  • 결과를 공유하고자 하는 사람이 누구인지 정의
  • 결과를 통해 원하는 변화를 생각
  • 회사 소속이라면, 경영자의 입장에서 보려고 노력
  • 많은 사람들과 의견을 나눠보는 것도 방법
  • 반드시 혼자서 오래 고민해보는 시간 가지기
profile
2 B R 0 2 B

0개의 댓글