24.01.04 데이터 리터러시

예진·2024년 1월 4일
0

TIL

목록 보기
12/68

데이터 리터러시

  • 데이터를 읽는 능력
  • 데이터를 이해하고 분석하는 능력
  • 결과를 의사소통에 활용할 수 있는 능력

= 데이터 수집과 원천 / 활용법 / 핵심지표를 이해하는 것

심슨의 역설 : ‘부분’에서 성립한 대소 관계가 ‘전체’에 대해서는 성립하지 않는 모순적인 경우

데이터 해석 오류 사례

시각화를 활용한 왜곡

  • 자료의 표현 방법에 따라 해석 오류 여지가 존재

샘플링 편향

  • 전체를 대표하지 못하는 편향된 샘플 선정으로 인한 오류 발생

상관관계와 인과관계

  • 상관관계 : 두 변수가 얼마나 상호 의존적인지 파악
    • 파악 방법 : 한 변수가 증가하면 다른 변수도 따라서 증가/ 감소하되 추이를 따름
  • 인과관계 : 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태
    • 원인과 결과가 명확한 것

데이터 분석 접근법

  • 문제 및 가설 정의 : 생각
  • 데이터 분석 : 작업
  • 결과 해석 및 액션 도출 : 생각

= 데이터 분석이 목적이 되지 않도록 ‘왜?’를 항상 생각해야 함

02. 문제 정의

문제 정의

  • 데이터 분석 프로젝트의 성공을 위한 초석
  • 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
  • 프로젝트의 목표를 설정하고 분석 방향을 결정

문제 정의 예제

  • 3개월 전에 무슨 일이 있었을까?
  • 타 회사 신제품? 계절의 변화? 재구매 연결 부족?
  • 포인트 이벤트 실패 요인?
  • 할인 부족? 광고 효과 미비, 포인트 이벤트 지속 필요성?
  • A와 B 비교
  • 서비스의 차이, B의 보완점 찾기

= 문제 정의는 복잡하고 시간이 소요되는 과정 “문제를 올바르게 정의하였는가?”

문제 정의를 위한 방법론 ; MECE

  • 문제 해결과 분석에서 널리 사용되는 접근 방식
  • 문제를 상호 배타적이면서 전체적으로 포괄적인 구성 요소로 나누는 것
  • 복잡한 문제를 체계적으로 분해, 구조화된 방식으로 분석

문제 정의를 위한 방법론 ; Logic Tree

  • MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해
  • 상위 문제로부터 시작하여 하위 문제로 계층적 접근
  • 도표 형식으로 표현되어 쉽게 파악 용이

로직트리 Cheat Sheet

  • 시장 / 점유율
  • 개념적으로 분류
  • 반대말 찾기
  • 세그먼트로 분류

문제정의는 왜?

  • 풀고자 하는 것을 명확하게 정의
  • 데이터 분석의 방향성
  • 결과를 정리하고 해석하여 더 나아지기 위한 액션 플랜 수립

So what? Why so?

  • So what?
  • 수집한 정보와 소재에서 결국 어떻다는 것인지?
  • 앞에 오는 정보나 소재에서 과제에 답변에 맞는 중요한 핵심을 추출
  • Why so?
  • 왜 그렇게 말할 수 있는지?
  • 타당성을 자료 전체 혹은 그룹핑한 요소로 증명할 수 있다는 사실 검증

문제 정의와 관련된 팁

  • 결과 공유할 사람이 누구인지 생각하기
  • 결과를 통해 원하는 변화를 생각하기
  • 경영자의 입장에서 생각하기
  • 많은 사람과 의견 나누기 / 혼자서 오래 고민하는 시간을 가지기

03.데이터의 유형

정성적 데이터 vs 정량적 데이터

정성적 데이터

  • 비수치적인 정보, 사람의 경험, 관점, 태도
  • 텍스트, 비디오, 오디오
  • 새로운 현상이나 개념에 대한 이해를 심화하는데 사용

정량적 데이터

  • 수치적으로 표현되는 정보
  • 통계적 분석 용이
  • 개인의 해석이나 주관이 적게 작용하는 객관성
  • 설문조사, 실험, 인구 통계, 지표 분석에 활용

정량적 데이터의 활용

  • 객관적, 측정 가능한 지표 만들기에 적합
  • 서비스의 건강 상태를 나타내는 중요한 지표를 확인 가능(NPS)
    -NPS Net Promoter Score : 추천 고객 비율 - 비추천 고객 비율

통계적 분석 적용

  • 데이터의 경향성과 패턴 파악
  • 해당 내용 근거로 의사결정 과정에서 중요한 판단

다양한 데이터 분석 방법 적용

  • 비즈니스 분석, 예측 모델링, 추세 분석 포함한 머신러닝과 같은 현대적 데이터 분석 기법에 활용
  • 미래 예측, 효율적 자원 배분, 시장 변화에 대한 적응 가능

04. 지표 설정

지표란?

  • 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
  • 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
  • 정의한 문제에 대해 정확하게 파악하기 위해서 필요

= 문제 정의를 통해서 ‘어떤 문제를 풀고자 하는가?’를 정의했다면, 지표는 ‘어떤 결과를 기대하는가?’에 대한 정량화된 기준

주요 지표 이해하기

1) Active User (활성 유저)

  • Active User에 대한 정의에 따라 전략과 방향이 달라짐
  • Active User에 대한 정의로 ‘이탈 유저’가 정의됨
  • 서비스 지표에 중요한 역할을 하게 됨
  • 정밀도, 허들이 높아질 수록 Active User의 수는 낮아지는 구조
    • 정밀도: 측정의 정밀함을 나타내는 정도

2) Retention Ratio (재방문율)

  • 고객이 서비스를 지속적으로 이용하고 있는지를 파악할 수 있음
  • 몇%의 유저가 우리 서비스를 다시 사용하는가?
  • 정의: 서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %
  • 리텐션이란 한번 획득한 유저가 서비스로 다시 돌아왔는가?에 대한 지표
  • 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
  • 리텐션은 서비스(특히 앱서비스) 성장에 있어서 매우 중요한 지표

Retention 측정 방법

  1. N-day 리텐션
  • 최초 사용일로부터 N일 후에 방문한 Active User의 비율
  • 일반적으로 사용하는 리텐션 지표
  • 유저가 액티브 유저로 집계된 최초 날을 Day 0으로 설정
  • Day 0에 액티브 상태가 된 모든 유저들의 N일차 리텐션 계산 서비스의 사용 주기가 길 경우, N-day 리텐션을 사용하면 실제보다 더 과소평가
  • N-day 리텐션은 사용자가 매일 접속하는 서비스에 활용하기 적절한 지표
  1. Unbounded 리텐션
  • 특정 날짜를 포함하여 이후에 재방문한 유저의 비율
  • 유저가 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합
    -
    Unbounded 리텐션은 이탈률의 반대 개념
    -오랜만에 접속한 유저가 있을 경우, 이전 리텐션 값들이 전부 변동되는 상황 발생
  • 사용 빈도가 높지 않은 서비스에 활용하기 적절한 지표
    • 채용 사이트

    • 쇼핑몰

    • 부동산 매물 서비스

      위와 같이 사용 주기가 좀 더 긴 서비스들에서는 N-day 리텐션을 적용하게 될 경우 불필요한 할인, 푸쉬 메시지 발송 등 잘못된 액션을 할 가능성이 존재

  1. Bracket 리텐션
  • 설정한 특정 기간을 기반으로 재방문율 측정
  • N day 리텐션 확장 개념 / 일,주,월 단위가 아닌 지정 구간으로 나눔
  • 활성유저가 특정한 활동을 위해 각 Bracket 내 서비스에 재방문시 잔존 유저로 해석
  • 하루 정도 서비스에 접속을 안했더라도, 리텐션에 영향을 주지 않기 때문에 기준이 조금 더 널널함
    -서비스 사용주기가 길거나 주기적인 경우 사용하기 적합한 지표
    - 식료품 배달 서비스
    - 세차 서비스

Retention에 대한 이해

  • 리텐션이 높은 세그먼트를 발굴하는 작업이 필요함
  • 서비스의 사용 주기에 따라 리텐션 조회 기간을 늘려야 함
  • 사후 분석 시에 용이

3) Funnel

  • 유저들이 어디서 이탈하는가?
  • 잠재고객을 유입, 최종적인 목표 액션을 달성할 때까지의 과자ㅓㅇ
  • 각 단계의 전환율 측정
  • AAARRR
  • 디지털 마케팅에 활용하는 프레임워크
  • 단계별 전환율을 지표화하여 서비스 보완 지점을 찾음

4) LTV

  • LTV (Life Time Value, 고객 평생 가치)
  • 고객 생애 주기: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간
  • 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화
  • 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
  • LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것
  • LTV 추측이 가능하다면, 신규 유저를 데려오는 비용(CAC: Customer Acquisition Cost)의 산출 및 효율적인 예산 운용이 가능

LTV 정리

북극성지표

1) 북극성 지표?

  • 제품/서비스의 ‘성공’을 정의
  • 유저에게 주는 core value를 나타낸 것
  • 장기 성장을 위해 필수적으로 모니터링

좋은 북극성 지표의 특징

  • 제품/서비스 전략의 핵심
  • 유저/고객이 제품/서비스에 느끼는 가치
  • 회사의 사업 목표를 나타내는 지표 중 선행 지표

좋은 북극성 지표를 위한 체크 리스트

  • 유저가 목적을 달성하는 때가 언제인가?
  • 모든 유저가 해당되나?
  • 측정 가능한 지표인가?
  • 측정 주기가 적절한가? (일, 주, 월, …)
  • 외부 요인으로부터 영향을 많이 받진 않는가?
  • 북극성지표의 성장이 사업의 성장과 함께하는가?
  • AARRR 퍼널 전 과정이 북극성 지표에 영향을 주는가?
  • 북극성 지표의 변화가 적어도 매주 관찰가능한가?

2) 북극성 지표의 유형

  • 사용시간 : 광고, 사용료 / 유튜브, 인스타, 넷플릭스
  • 거래량 : 판매액, 수수료 / 쿠팡, 에어비앤비
  • 효용 : 사용료 / 슬랙, 줌

3) 북극성 지표가 중요한 이유

  1. 방향성
    • 제품/사업 조직이 무엇에 최적화되어야 하고, 무엇을 포기해도 되는 지에 대한 방향 제시
    • 제품/사업 조직의 진척과 가치창출을 전사에 보여줌
      • 지원 조직이 더욱 적극적으로 지원, 제품개발 액션 실행속도가 빨라짐
    • 제품/서비스 조직이 결과에 책임을 지도록 함
      • 비즈니스 임팩트에 따라 평가가 가능
  2. 효율 증대
    • 전 직원을 하나의 목표에 집중시킴
    • 서로 상반된 목표에 집중하거나, 중복으로 일하는 것을 방지 (MECE한 구조)

05. 결론 도출

1) 결과와 결론의 차이

  • 결과 : 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
  • 숫자, 통계, 그래프, 차트 등의 형태
  • 계산과 분석을 통한 결과물 (보통 많이 말하는 것)
  • 결론 : 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
  • 데이터에 기반한 해석, 추론, 권고사항을 포함
  • 목적에 대해 어떤 의미가 있는지 설명 (실제 필요한 것)

결론 도출 시 주의사항

  • 결과 - 결론 도출 시에는 스토리텔링이 필요
  • 그러나, 필요 이상으로 자신의 해석을 융합하면 안됨

2) 결론을 잘 정리하는 법

  • 앞서 문제 정의, 지표 설정을 할 당시 목적을 떠올리며 정리
  • 결론을 공유할 대상과 원하는 바를 생각하기
  • 단순하고 쉽게 전달
  • 핵심 지표 위주로 먼저 공유
  • 지표를 해석하는 방법에 대해서도 설명
  • 해당 지표에 오너십이 있는 조직에서 활용할만한 포인트 제안
  • 액션 아이템을 제안 하는것이 핵심
  • 흥미 유발
  • 모든 내용을 담지 않고 흥미로운 부분 위주로 공유
  • 상대가 궁금해할만한 내용은 뭘까? 고민하고 필터링 하기
  • 궁금한 사람들을 위해서는 디테일한 문서 따로 공유
  • 대상자 관점에서의 접근
  • 공유 받는 사람의 시선에서 이해하기 쉽도록 정리
  • 지식의 저주에 빠지지 않고 논지를 뒷받침 해줄 자료들을 함께 첨부
  • 대상자의 허들이 낮은 시각화 활용
  • 시각화 팁
  • 화려한 그래프 보다는 대상이 직관적으로 이해할 수 있도록 구성
  • 보통 선, 막대 그래프로 거의 대부분의 리포팅이 가능
  • 각 그래프의 범례와 단위 함께 표기해주기
  • 결론 보고서에 쓰면 좋은 플로우
  • 전체 내용을 한 문장으로 정리하는 요약
  • 해당 보고서의 메인 주제
  • 해당 보고서를 쓴 이유와 원하는 변화
  • 문제 정의 단계
  • 핵심 내용 전개
  • 결론 및 액션 아이템

3) 데이터 리터러시란?

  • 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의하는 것
  • 그 목적을 달성하는데 필요한 데이터와 지표를 설정하는 것
  • 데이터를 어떻게 봐야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것
  • 단순히 데이터를 보는 방식이나 분석 방법론, 통계지식에 매몰되지 않는 것
  • 왜?를 항상 생각하기

데이터 리터러시란?

  • 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의하는 것
  • 그 목적을 달성하는데 필요한 데이터와 지표를 설정하는 것
  • 데이터를 어떻게 봐야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것
  • 단순히 데이터를 보는 방식이나 분석 방법론, 통계지식에 매몰되지 않는 것
  • 왜?를 항상 생각하기

문제 정의

  • 프로젝트의 목표 설정, 분석 방향 결정 (명확하고 구체적인 진술)
  • MECE, Logic Tree
  • So what? Why so?

지표 설정

  • 목표 달성과 전략적 결정에 필요한 구체적이고 측정 가능한 기준
  • Active User, Retention Ration(N-day, Unbounded, Bracket), Funnel, LTV
  • 북극성 지표

결론 도출

  • 문제 정의, 지표 설정 당시 목적을 떠올리며 정리
  • 단순하고 쉽게 전달
  • 대상자 관점에서의 접근
profile
Data Analysis / 맨 땅에 헤딩

0개의 댓글