Chapter1 D-5 TIL

홍유택·2025년 1월 7일

01. 데이터 리터러시

- 1) 데이터 리터러시의 정의

☑️ 데이터 리터러시(Data Literacy)

  • 데이터를 읽는 능력
  • 데이터를 이해하는 능력
  • 데이터를 비판적으로 분석하는 능력
  • 결과를 의사소통에 활용할 수 있는 능력

☑️ 데이터 리터러시란?

  • 데이터 수집과 데이터 원천을 이해하고
  • 주어진 데이터에 대한 다양한 활용법을 이해하고
  • 데이터를 통한 핵심지표를 이해하는 것
  • 데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어 줌

- 2) 데이터 해석 오류 사례

☑️ 심슨의 역설 (Simpson’s Paradox)

  • '부분'에서 성립한 대소 관계가 그 부분들을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우를 말한다.

☑️ 시각화를 활용한 왜곡

  • 자료의 표현 방법에 따라서 해석의 오류 여지가 존재

☑️ 샘플링 편향 (Sampling Bias)

  • 전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류가 발생

☑️ 상관관계와 인과관계

  • 상관관계
    • 두 변수가 얼마나 상호 의존적인지를 파악하는 것을 의미
    • 파악 방법은 한 변수가 증가하면 다른 변수도 따라서 증가/감소하되 그 추이를 따름
  • 인과관계
    • 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태를 의미
    • 원인과 결과가 명확한 것

- 3) 데이터 리터러시가 필요한 이유

☑️ 데이터 분석에 대한 접근법

  • 크게 3가지 단계로 구분
    • 문제 및 가설정의
    • 데이터 분석
    • 결과 해석 및 액션 도출
  • 위 단계 중 ‘생각’이 주요한 단계에서 데이터 리터러시가 필요
  • 데이터 분석이 목적이 되지 않도록 ‘왜?’를 항상 생각해야 함

02. 문제정의

1) 문제 정의란?

☑️ 데이터 분석에 실패하는 이유

  • 데이터 리터러시 단원에서 정리했던 것처럼, 풀고자 하는 문제를 명확하게 정의하지 않음

☑️ 문제 정의란?

  • 데이터 분석 프로젝트의 성공을 위한 초석
  • 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
  • 프로젝트의 목표를 설정하고 분석 방향을 설정

2) 문제 정의 방법론

☑️ MECE (Mutually Exclusive, Collectively Exhaustive)

  • 문제 해결과 분석에서 널리 사용되는 접근 방식
  • 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나누는 것
  • MECE를 통해 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음

☑️ 로직 트리(Logic Tree)

  • MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
  • 상위 문제로부터 시작하여 하위 문제로 계층적 접근
  • 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음

03. 데이터의 유형

☑️ 정성적 데이터 (Qualitative Data)

  • 비수치적인 정보로 사람의 경험, 관점, 태도와 같은 주관적인 요소를 포함해요
  • 대부분 텍스트, 비디오, 오디오 형태로 존재해요
  • 정형되지 않고 구조화 되어있지 않아요
  • 데이터를 구조화하기 어려워요
  • 새로운 현상이나 개념에 대한 이해를 심화하는데 사용해요

☑️ 정량적 데이터 (Quantitative Data)

  • 수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있어요
  • 데이터가 숫자 형태로 존재하기 때문에 통계적으로 분석하기 쉬워요
  • 개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있어요
  • 지표로 만들기에 용이해요
  • 설문조사, 실험, 인구 통계, 지표 분석 등에 활용해요

04. 지표 설정

☑️ 지표란?

  • 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
  • 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
  • 정의한 문제에 대해 정확하게 파악하기 위해서 필요

☑️ Retention Ratio의 역할

  • 몇%의 유저가 우리 서비스를 다시 사용하는가?
  • 정의: 서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %
  • 리텐션이란 한번 획득한 유저가 서비스로 다시 돌아왔는가?에 대한 지표
  • 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
  • 리텐션은 서비스(특히 앱서비스) 성장에 있어서 매우 중요한 지표

☑️ Funnel의 역할

  • 유저들이 어디서 이탈하는가?를 확인하기 위한 구조화
  • 퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
  • 모든 서비스와 비즈니스는 각 단계로 갈 수록 이용자 수가 줄어들게 됨
  • 각 단계의 전환율 (or 첫 유입 대비 전환율)을 측정

☑️ AARRR

  • 디지털 마케팅시 퍼널을 활용하는 프레임워크
  • 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음
    • Acquisition: 유입
    • Activation: 활성화
    • Retention: 재방문(재구매)
    • Revenue: 수익
    • Referral: 추천

☑️ LTV의 역할

  • 해당 유저가 우리에게 평생 주는 이익은 얼마나 될까?
  • 고객 생애 주기: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간
  • LTV는 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
  • LTV는 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
  • LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것

북극성 지표

1) 북극성 지표란?

☑️ 북극성 지표

  • 제품/서비스의 ‘성공’을 정의
  • 제품/서비스가 유저에게 주는 core value를 가장 잘 나타낸 것
  • 장기 성장을 위해 필수적으로 모니터링 해야 함

☑️ 좋은 북극성 지표의 특징

  • 제품/서비스 전략의 핵심
  • 유저/고객이 제품/서비스에서 느끼는 가치
  • 회사의 사업 목표를 나타내는 지표 중 선행지표 (후행X)

☑️ 좋은 북극성 지표를 위한 체크리스트

  • 유저가 목적을 달성하는 때가 언제인가?
  • 모든 유저가 해당되나?
  • 측정 가능한 지표인가?
  • 측정 주기가 적절한가? (일, 주, 월, …)
  • 외부 요인으로부터 영향을 많이 받진 않는가?
  • 북극성지표의 성장이 사업의 성장과 함께하는가?
  • AARRR 퍼널 전 과정이 북극성 지표에 영향을 주는가?
  • 북극성 지표의 변화가 적어도 매주 관찰가능한가?

05. 결론 도출

1) 결과와 결론의 차이

☑️ 결과

  • 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
  • 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
  • ex) “고객 설문 조사 데이터를 분석한 결과, 고객 만족도와 구매 빈도 사이에 강한 상관관계가 있음을 보여줄 수 있습니다.”
  • 계산과 분석을 해서 나온 결과물

☑️ 결론

  • 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
  • 데이터에 기반한 해석, 추론 또는 권고 사항을 포함
  • ex) “고객 만족도와 구매 빈도 사이의 강한 상관관계를 보여주는 결과를 토대로, 고객 만족도 향상이 전반적인 매출 증가로 이어질 수 있다는 결론을 내릴 수 있습니다.”
  • 목적에 대해 어떤 의미가 있는지 설명하는 것

☑️ 결론 도출 시 주의사항

  • 결과 - 결론 도출 시에는 스토리텔링이 필요
  • 그러나, 필요 이상으로 자신의 해석을 융합하면 안됨
    • 데이터를 통해 알 수 있는 범위에서만 생각해야 함
profile
안녕하세요

0개의 댓글