☑️ 데이터 리터러시(Data Literacy)
- 데이터를 읽는 능력
- 데이터를 이해하는 능력
- 데이터를 비판적으로 분석하는 능력
- 결과를 의사소통에 활용할 수 있는 능력
☑️ 데이터 리터러시란?
☑️ 심슨의 역설 (Simpson’s Paradox)
- '부분'에서 성립한 대소 관계가 그 부분들을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우를 말한다.
☑️ 시각화를 활용한 왜곡
- 자료의 표현 방법에 따라서 해석의 오류 여지가 존재
☑️ 샘플링 편향 (Sampling Bias)
- 전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류가 발생
☑️ 상관관계와 인과관계
- 상관관계
- 두 변수가 얼마나 상호 의존적인지를 파악하는 것을 의미
- 파악 방법은 한 변수가 증가하면 다른 변수도 따라서 증가/감소하되 그 추이를 따름
- 인과관계
- 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태를 의미
- 원인과 결과가 명확한 것
☑️ 데이터 분석에 대한 접근법
- 크게 3가지 단계로 구분
- 문제 및 가설정의
- 데이터 분석
- 결과 해석 및 액션 도출
- 위 단계 중 ‘생각’이 주요한 단계에서 데이터 리터러시가 필요
- 데이터 분석이 목적이 되지 않도록 ‘왜?’를 항상 생각해야 함
☑️ 데이터 분석에 실패하는 이유
- 데이터 리터러시 단원에서 정리했던 것처럼, 풀고자 하는 문제를 명확하게 정의하지 않음
☑️ 문제 정의란?
- 데이터 분석 프로젝트의 성공을 위한 초석
- 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
- 프로젝트의 목표를 설정하고 분석 방향을 설정
☑️ MECE (Mutually Exclusive, Collectively Exhaustive)
- 문제 해결과 분석에서 널리 사용되는 접근 방식
- 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나누는 것
- MECE를 통해 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음
☑️ 로직 트리(Logic Tree)
- MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
- 상위 문제로부터 시작하여 하위 문제로 계층적 접근
- 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음
☑️ 정성적 데이터 (Qualitative Data)
- 비수치적인 정보로 사람의 경험, 관점, 태도와 같은 주관적인 요소를 포함해요
- 대부분 텍스트, 비디오, 오디오 형태로 존재해요
- 정형되지 않고 구조화 되어있지 않아요
- 데이터를 구조화하기 어려워요
- 새로운 현상이나 개념에 대한 이해를 심화하는데 사용해요
☑️ 정량적 데이터 (Quantitative Data)
- 수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있어요
- 데이터가 숫자 형태로 존재하기 때문에 통계적으로 분석하기 쉬워요
- 개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있어요
- 지표로 만들기에 용이해요
- 설문조사, 실험, 인구 통계, 지표 분석 등에 활용해요
☑️ 지표란?
- 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
- 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
- 정의한 문제에 대해 정확하게 파악하기 위해서 필요
☑️ Retention Ratio의 역할
- 몇%의 유저가 우리 서비스를 다시 사용하는가?
- 정의: 서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %
- 리텐션이란 한번 획득한 유저가 서비스로 다시 돌아왔는가?에 대한 지표
- 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
- 리텐션은 서비스(특히 앱서비스) 성장에 있어서 매우 중요한 지표
☑️ Funnel의 역할
- 유저들이 어디서 이탈하는가?를 확인하기 위한 구조화
- 퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
- 모든 서비스와 비즈니스는 각 단계로 갈 수록 이용자 수가 줄어들게 됨
- 각 단계의 전환율 (or 첫 유입 대비 전환율)을 측정
☑️ AARRR
- 디지털 마케팅시 퍼널을 활용하는 프레임워크
- 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음
- Acquisition: 유입
- Activation: 활성화
- Retention: 재방문(재구매)
- Revenue: 수익
- Referral: 추천
☑️ LTV의 역할
- 해당 유저가 우리에게 평생 주는 이익은 얼마나 될까?
- 고객 생애 주기: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간
- LTV는 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
- LTV는 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
- LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것
1) 북극성 지표란?
☑️ 북극성 지표
☑️ 좋은 북극성 지표의 특징
☑️ 좋은 북극성 지표를 위한 체크리스트
☑️ 결과
- 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
- 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
- ex) “고객 설문 조사 데이터를 분석한 결과, 고객 만족도와 구매 빈도 사이에 강한 상관관계가 있음을 보여줄 수 있습니다.”
- 계산과 분석을 해서 나온 결과물
☑️ 결론
- 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
- 데이터에 기반한 해석, 추론 또는 권고 사항을 포함
- ex) “고객 만족도와 구매 빈도 사이의 강한 상관관계를 보여주는 결과를 토대로, 고객 만족도 향상이 전반적인 매출 증가로 이어질 수 있다는 결론을 내릴 수 있습니다.”
- 목적에 대해 어떤 의미가 있는지 설명하는 것
☑️ 결론 도출 시 주의사항
- 결과 - 결론 도출 시에는 스토리텔링이 필요
- 그러나, 필요 이상으로 자신의 해석을 융합하면 안됨
- 데이터를 통해 알 수 있는 범위에서만 생각해야 함