데이터 시각화

솔비·2024년 4월 15일
0

🧷 Data Analysis

목록 보기
4/5

시각화 전 고려사항


데이터 시각화의 시작은 목적이다.
목적없이 시각화를 한다면, 논리적이지 못한 결론을 도출 할 수 있다.



1) Who | 이걸 보는 사람은 누구인가?

사용 목적에 맞는 지표 구성과 대시보드 설계

관리자와 실무자의 대시보드 보는 관점이 다르기 때문에 누가 대시보드를 사용하는지에 따라 시각화하는 관점이 달라진다.

2) Why | 그 사람들이 이걸 왜 봐야 하는가?

조직에 의미있는 데이터 시각화를 설계하기 위한 준비

내가 만드는 시각화가 요청부서 혹은 조직에 왜 중요한지, 어떤 효과를 야기할것인지를 고려해야한다.

3) What | 이를 위해 무슨 지표가 필요한가?

  • 상대적인 지표
    : 시간, 그룹(카테고리/브랜드) 지표의 변화율

    • 시각화에서 인사이트를 도출하려면 기본적으로 비교가 가능해야 한다.
      ex) 전주 대비 유료결제 전환율, 전월대비 수익 증감율, 전년동일 프로모션대비 평균 매출증감율
  • 비율을 나타내는 지표
    : 실제 사용자들의 참여도를 나타내는 학습과 액션이 가능한 지표

    • 비즈니스에 임팩트가 있는 인사이트를 얻으려면 프로덕트/서비스의 실질적인 현황을 반영할 수 있어야 한다.
      ex) 고객 재방문율, 활성 사용자 비율, 유료 구독 전환율, 장바구니 전환율
  • 액션이 가능한지표
    : 후행지표 (예 : 매출, 수익) 등에 선행하는 선행지표

    • 선행지표 일수록 해당 지표를 개선하는 방법이 명확해서, 후행지표와 달리 실제 액션 (예: UX 개선)에 반영하기 쉽다.
      ex) 유료 구독 배너 클릭 전환율, 광고 소재별 클릭 전환율, 회원가입 배너 클릭 전환율

4) How | 그래서 어떻게 대응할 수 있을 것인가?

시각화의 기본은 “비교”를 통한 인사이트
시각화에서 지표를 비교하고 평가할 수 있도록 하여 그 데이터가 갖는 의미를 해석할 수 있도록 하는 것이 중요하다.

  • 비율로 바꿔서 보기
    범주 간 지표 값의 Scale 이 차이 날 경우 유저 입장에서 지표의 좋고 나쁨 평가가 어렵기 때문
    ex) 카테고리별 전년 대비 매출 증감율을 비교하는 라인 그래프

  • 전체와 비교해보고, 비슷한 카테고리끼리 묶어서 보기
    전체 평균과 비교하여 어떤지 평가, 비슷한 카테고리와 비교하여 어떤지 평가
    ex) 전체 카테고리 평균 전년 대비 매출 증감율과 비교
    ex) 동일 카테고리의 단가가 비슷한 다른 브랜드와 전년 대비 매출 증감율 비교

5) When | 이게 언제 필요한가?

의미 있는 인사이트를 얻기 위한 단위로 구분

6) Actionable | 액션을 취할 수 있는가?

  • 대시보드 제작 시 High-level 지표 트렌드 뿐 아니라,
    Input 메트릭또한 추가되어야 왜 지표가 움직였고,
    어떤 것이 영향을 미쳤는지 알 수 있다.
  • 중요한 변화에서 인사이트를 도출할 수 있는 Flow 를 만들어야
    원하는 Outcome 을 위한 Action 을 취할 수 있다.
    ex)

    위 대시보드처럼 프로모션의 KPI만 시각화하는것이 아닌
    달성에 영향을 미치는 여러부분을 추가하는것이 좋다.





데이터 시각화 유형


1) 대시보드의 구조

KPI 영역


주요 KPI에 대한 현황파악

Overview 영역


전체 데이터를 한눈에 볼 수 있는 부분
(세부 데이터 분석 전 확인용도)

Depth 영역


ex) 카테고리별 데이터 클릭 시 (depth 1) 해당 카테고리 브랜드 매출 (depth 2)등등

Action Items 영역


실무자가 딥다이브하게 분석할 수 있도록 내려받기 가능한 데이터
(raw 데이터영역과 비슷)



2) 데이터시각화 유형

라인차트의 경우 : 시간, 트렌드에 따른 변화를
막대차트의 경우 : 범주별 차이나 세부비교를
도넛차트의 경우 : 전체대비 특정부분의 비율을
시각화하기에 용이하다.



기본 차트로는 표현이 어려울 때

- Sankey Diagram

데이터 흐름을 단순화해서 표현하기에 효과적

분석 활용 방안
유저 전환의 일반적인 공통 경로 확인 > 유입 경로 퍼널 분석 기반
전환에 방해가 되는 요소 확인 > 퍼널 이탈률 개선 인사이트
광고 캠페인의 랜딩페이지별 유저 경로 확인 > 캠페인 개선 인사이트
주의할 점
노드가 많거나, 링크의 두께가 비슷한 경우 비교하는 데 한계

- Gauge Chart

현재 성과 수준의 맥락과 현황 빠르게 확인 가능
전체 게이지 : 타겟 / 바 : 이번 성과 / 선 : 지난 성과
게이지 내 바의 위치로 진행도 확인

분석 활용 방안
매출 목표와 판매 실적 비교 > 달성률 기반으로 목표 조정
유지 관리 비용 모니터링 > 비용 최적화
NPS (고객 추천 지수) 개선 > 반복적 문제 식별 / Promoter 보상
주의할 점
공간 차지 넓음 / 차트에서 성과를 제외한 세부 사항 파악 어려움

- Radar Chart

두 개 이상의 데이터셋의 평가 항목이 여러 개인 경우 비교에 효과적
각 축은 다른 데이터 변수를 나타냄
중심으로부터 평가항목의 값에 따라 점을 찍고 선으로 연결

분석 활용 방안
리전별 주요 KPI 비교
고객 만족도 비교
Product 강점 비교

주의할 점
영역의 넓이로 표현되어 제곱되기 때문에 왜곡 가능
배열 순서에 따라 강조되는 포인트가 많이 다르게 보임





시각화 인사이트 도출


1) 지표평가하기

적합한 대상과의 비교를 통해 지표 평가 (예 : 유사 카테고리, 전체 평균, 이전 동일 기간 대비 등)
평균의 함정을 주의할 것 (데이터 분포 확인)

  • 비교기준

    • 지표집계 : : 합계, 평균 등 데이터에 적합한 집계 방식
    • 비교 대상 : 유사 카테고리 / 전체 평균 / 이전 동일 기간 대비 등 비교에 적합한 대상
    • ex) 작년 동일 종류 프로모션 매출 합계 대비 올해 프로모션 매출, 전체 카테고리 평균 매출 대비 A 카테고리 매출
  • 비교 시각화

    • 📈 라인 차트 (추이)
      예) 매출 트렌드 라인, 매출 증감율 라인 등 > 전년 동일 기간 대비 매출 증감율 비교
    • 📊 막대 차트 (편차,양)
      예) 월별 판매량 등 > A, B ,C 브랜드의 월별 판매량 편차 비교
    • 🍩 비율 막대 차트, 도넛 차트 (구성 비율)
      예) 전체 매출에서 A가 차지하는 비율 > 프로모션 전체 매출에서 기존 대비 신규 유저가 차지하는 비율 비교

2) 원인 후보 나열하기

지표에 영향을 준 원인 탐색 (Metric Hierarchy, User Funnel)
예) 이벤트 유무 / 객단가, 구매전환율, 구매횟수 증감율 / 신규 기존 유저별 / 브랜드 및 상품별 / 광고비 영향 / CRM 영향

관련 모든 지표들을 나열해보기

ex)
문제
: 패션 커머스의 이번 분기 매출이 전년 동기 대비 30% 떨어졌다. 
원인 후보
: 영향을 준 특정 이벤트 유무 (ex. 프로모션, 라플)
객단가 증감율, 구매 횟수 증감율, 구매 전환율 증감
신규 or 재구매 유저 비율 증감, 신규 회원가입 비율
브랜드별, 상품별 매출 증감율
광고 매체별 광고비에 따른 영향도
CRM 푸시메시지, 쿠폰 발급 등에 따른 영향도

3) Drill down 분석

시간에 따른 변화 / 그룹 쪼개기 / 이상치 확인 / 경향성과 상관관계 파

  • 특정 지점에서의 변화점 파악

특정 분기점 전후에 어떤 차이가 있는지 초점을 맞춰
문제에 대한 원인 파악 및 분석 결과에 미치는 영향 확인

ex) 응모 이벤트 때문에 신규 가입 유저가 갑자기 튀었고, 그래서
최근 1달 신규 유저 구매 전환율이 하락했다.
➡️ 특정 상품에만 관심 가진 체리피커 유저들로 구매전환율 하락
이벤트 종료 후 상당수가 앱을 삭제하여 이탈할 가능성 고려
  • 고객 RFM (Recency, Frequency, Monetary) 세그멘테이션
예 1)“이탈 VIP 고객” 들이 재로그인 하는 경우 쿠폰을 증정하면 모든 고
객에게 증정하는 것보다 효과적인 마케팅을 할 수 있다.큰 금액을 소비
하며 자주 방문했지만 오랫동안 구매 이력이 없었던 고객들을 구분
예 2)“VIP 고객” 들을 위한 감사 이벤트를 진행하여 고객들의 충성도를
높일 수 있다.큰 금액을 소비하며, 자주 방문하고, 최근에도 지속적으로
구매 이력이 있는 고객들을 구분
예 3)“신규 고객” 들을 위한 Welcome 쿠폰을 증정하여 고객들의 재
방문율을 높일 수 있다.최근 방문한 고객일수록 프로모션에 반응할 가능
성이 높다는 점을 활용
  • 주요 성과 세그먼트 나누기

어떤 프로모션이 단기적인 매출 증가 뿐만 아니라 유저의 장기
적인 충성도 증대에 도움이 되는가?
이후 프로모션을 장기적/단기적 성과 중 어디에 초점을 맞추
어 진행할 지에 따라 참고할 프로모션을 선택

  • 이상치가 지표에 미친 영향 확인

분석 목적에 따라 이상치 제외 후 계산 가능

예) 프로모션 효과 분석
매출 상승 > 특정 상품의 매출 상승 > 유저당 구매 수량 확인
사재기 유저 (이상치) 로 인한 결과는 아닌지 파악
분석 목적에 따라 포함 / 또는 제외 결정
  • 시각적으로 전체적인 경향성 파악 : X축과 Y축의 관계

4) 이외의 맥락보기

원인은 하나가 아닐 수 있으므로 외부 상황에 대한 관찰도 필요

마침 쿠폰 발행을 시작한 시점에 인플루언서가 특정 브랜드 제품을 홍보해서 바이럴 됐다면,
쿠폰 발행 빈도와 관계없이 
간접적으로 방문, 구매자 수 증가라는 결과에 영향을 줄 수 있다





시각화 디자인


1) 시각화 종류

[변화]

  • 라인차트

    • 연속형 데이터의 트렌드 표현에 주로 사용
      전반적인 트렌드 증가/감소 변화 확인
    • 축이 0에서 시작할 필요는 없음
    • 라인이 많은 스파게티형 차트는 혼란 유발
  • 컬럼차트

    • 시간에 따른 변동을 보여주거나 서로 다른 카테고리의 값을 비교할 때 사용
    • 축은 0부터 시작해야함
    • 시간에따른 변화를 보여줄 때는 바 X 컬럼 O
  • 영역차트

  • 시간의 흐름에 따른 변화를 보여주지만, 라인차트와 달리 Volume을 함께 표현가능
  • 영역차트의 카테고리가 두개 이상일 경우 다른 영역 위에 표시되어 정확한 비교 어려움

[비율]

  • 비율바차트
    • 전체에서의 구성비율을 간단하게 표현
    • 도넛차트에 비해 작은 공간 활용
  • 도넛차트

  • 전체에서의 구성비중을 비교
  • 가운데 빈공간 활용가능
  • 비교하는 갯수가 5-6개 이하일경우 추천
  • 파이차트와 달리 길이 속성 활용 가능

[비교]

  • 바차트

    • 서로다른 카테고리의 값 비교에 주로 활용
    • 축은 0부터 시작
    • 데이터 레이블이 길 경우 효과적
    • 갯수가 많은 경우 컬럼차트보다 효과적
  • 그룹차트

    • 서로 다른 카테고리의 값을 여러개 비교할 때 주로 활용
    • 축은 0부터 시작
  • 히트맵

    • 데이터값을 컬러로 변환시켜 많은 데이터의 패턴을 한번에 볼때 주로 사용
    • 색상 팔레트 범례가 있어야함
  • 산점도

    • 두 변수의 관계를 보여주기 위해 주로 사용
    • 상관관계 시각화에 자주 쓰임
    • 데이터 포인트가 많으면 Overfloating 문제발생
    • X축에 선행지표, Y축에 후행지표

차트 활용 시 주의점

  • 3D 차트는 값을 왜곡할 가능성이 있어 쓰지 않음
  • 파이차트는 각도를 통해 정확한 비교가 불가능하기 때문에, 길이 속성을 활용하는 도넛 차트가 더 좋은 선택
  • 막대그래프의 목적이 값의 비교일 경우 축은 0 부터 시작할 것
  • 라인그래프의 목적이 경향 파악이라면 축은 꼭 0 부터 시작하지 않아도 됨
  • 스캐터 플랏은 X 축에 선행지표, Y 축에 후행지표
  • 시간의 축은 X 축 (가로) 기본






패스트캠퍼스 그로스 리더와 세계 3등에게 배우는 13개 데이터 분석 프로젝트
Study Note
profile
Study Log

0개의 댓글