[SQL활용Redash보고서] _3_비즈니스 실적 평가 지표 데이터 분석 시각화 보고서

Hyejin Beck·2024년 2월 11일
0

데이터베이스(SQL)

목록 보기
27/40
post-thumbnail

단순히 개별 지표를 추출하는 것을 넘어 이를 시각화하여 보고서 형태로 만들어 봅니다. 이를 위해 먼저 지표라는 것이 무엇인지, 어떻게 정의하고 측정할 것인지 알아봅니다. 그리고 다양한 표와 그래프를 활용한 시각화 방법과, 데이터 분석 보고서 작성 방법에 대해 알아보고 직접 보고서를 작성해 봅니다.

진행 순서
1) 지표에 대한 이해
2) 다양한 시각화 방법
3) 분석 보고서 작성 방법
4) 실전 분석 보고서 작성 업무를 수행

1. 지표

지표란 기업에서 어떤 대상(서비스, 프로덕트, 사람 등)의 성과 평가를 하기 위해 사용되는 기준을 말합니다. 예를 들어 새로 진행한 온라인 광고의 성과 평가를 위해 ‘노출수, CTR(Click-Through Rate, 클릭률), CVR(Conversion Rate, 전환율)’ 등을 본다고 했을 때 각각이 지표가 됩니다.

데이터 사이언스 직군으로 입사를 하게 되면 가장 초반에 맡는 업무 중에 하나가 팀에서 관리하는 지표를 추출하거나 추이를 모니터링을 하면서 현황을 분석하는 일입니다. 이를 위해서는 서비스 프로세스를 잘 이해하고, 다양한 로그 데이터와 DB에서 원하는 데이터를 적절히 뽑아낼 수 있는 능력이 필요합니다. 주니어 레벨에서는 비교적 잘 정리된 RDB에서 데이터를 추출하는 경우가 대부분이기 때문에 SQL 활용 능력이 특히 중요합니다.

보통은 정해져있는 지표가 있지만 가끔은 새로 지표를 정의해야 할 수도 있습니다. 혹은 기존에 있는 지표에 대한 개선 아이디어를 도출하는 업무를 맡기도 합니다. 그런 상황을 대비해서 좋은 지표가 무엇인지 고민해 볼 필요가 있습니다. 제가 생각하는 좋은 지표란 다음과 같습니다.

1. 수치로 나타낼 수 있어야 한다.

숫자로 표현할 수 있는 측정 가능한 지표만이 객관적이고 명확한 의미를 가질 수 있습니다.

2. 절대값보다는 비율로 나타내야 한다.

이번달 신규 가입자 수가 1만명이라고만 하면 이게 많은지 적은지 알 수 없습니다. 전월 가입자수는 5천명 이라는 기준점을 제시해주거나, 전월 대비 신규가입자수 증가율이 200%이다 와 같이 표현하는 것이 좋습니다.
또 방문자 수 대비 가입자 수와 같은 비율을 사용할 수도 있습니다.

3. 핵심을 파악할 수 있는 최소한의 지표만 남겨야 한다.

지표가 너무 많으면 관리하기도 어렵고, 지표를 보면서 제대로 된 인사이트를 얻기가 힘듭니다. 서비스 현황을 파악할 수 있는 핵심 지표 몇가지만 정하는 것이 중요합니다.

이런 기준에 입각해 Northwind 회사의 비즈니스 실적을 평가할 수 있는 좋은 지표를 만들어 보도록 합시다.

2. 시각화

1. 산점도 Scatter Plot

2. 꺾은선 Line Chart

3. 막대 Bar Chart

4. 히스토그램 Histogram

막대 그래프와 유사해 보이지만 전혀 다른 시각화 방법입니다. x축은 각 계급을 나타내고, y축은 그 계급에 속하는 데이터의 빈도수를 나타냅니다.
히스토그램을 도수분포표라고 하기도 합니다.

5. 파이차트 Pie Chart

6. 박스플롯 Box Plot

3. 분석 보고서 작성

좋은 분석은 좋은 질문으로부터 시작합니다. 분석 보고서를 쓰는 좋은 방법 중 하나도 가설로부터 시작하는 것입니다.

검증하고자 하는 가설을 정하고, 그 가설을 검증하기 위한 지표를 정하고, 그 값을 분석함으로써 가설을 검증한 결과를 서술하고, 그 과정에서 얻은 인사이트를 최종 결론으로 첨부하면 됩니다.
가설 수립(지표설정) -> 가설 검증(분석) -> 결과 (보고서 작성)

정리하면 분석 보고서는 '가설 수립 > 가설을 검증하기 위한 지표 선정 > 지표 측정 및 분석 > 분석 결과 및 결론(인사이트)' 순으로 작성하면 됩니다.
분석 보고서를 이런 식으로 작성했을 때 좋은 점은 논리의 흐름이 담겨있어 이해하기 쉽고, 읽는 사람으로부터도 객관적인 피드백을 기대할 수 있다는 점입니다.

'A라는 가설을 세운 것 까지는 좋은데 이걸 검증하기 위한 지표로 ㄱ외에 ㄴ도 추가로 보면 좋을 것 같은데?'
'방문자수 지표 전체로 놓고보면 증가한게 맞는데 연령별로 차이가 있을 수도 있지 않을까? 연령별로 나눠서도 보자.'

이런 식으로 내가 만들어 놓은 논리의 흐름 위에서 추가적인 피드백을 통해 보다 완성도 있는 보고서로 발전해 나갈 수 있습니다.
반면 작성한 사람의 논리가 객관적으로 파악되지 않는 보고서라면 읽는 사람도 중구난방 떠오르는대로 피드백을 하게 되고 그러면 작성자 입장에서도 당황스러울 수 있습니다.
'일단 피드백을 받았으니 수정을 하긴 해야겠는데 이 사람 저 사람 말이 다 다른 것 같고, 이럴바엔 백지로 돌아가서 처음부터 다시 고민해봐야겠다.'라는 것이 신입사원 때 분석 보고서를 처음 작성해보면 흔히 겪는 어려움 입니다.

이런 시행착오를 줄이기 위해 논리적, 객관적으로 보고서를 쓰는 것이 중요하고, 그러기 위한 방법으로 위에서 설명드린 순서대로 보고서를 구성할 것을 추천합니다.

4. 가설 기반 보고서 작성

(1) 가설 수립
(2) 검증 위한 지표 선정
(3) 지표 측정 및 분석
(4) 분석 결과 및 결론

가설1. 근무년속이 오래된 직원일수록 판매율이 높을까요?

  • 입사날짜(HireDate)
    • 테이블: Employee
  • 주문량(Quantity)
    • 테이블: OrderDetail
  • 주문횟수(orderid)
    • 테이블: OrderDetail

가설2. 미국인들이 주문당 구매금액이 높을까요?

  • 국적(Country)
    • 테이블: Customer
  • 국적당 고객수 count()
    • 테이블:
  • 총주문금액 quanitiy * unitprice
    • 테이블: OrderDetail
    • 테이블: OrderDetail
  • 1인당 주문금액 per_order

가설3. 원래 저렴한 제품보단 할인하는 제품의 판매율이 높을까요?

  • 주문량(Quantity)
    • 테이블: OrderDetail
  • 제품 가격(UnitPrice)
    • 테이블: OrderDetail
  • 할인율(Discount)
    • 테이블: OrderDetail
  • 주문횟수(orderid)
    • 테이블: OrderDetail
profile
데이터기반 스토리텔링을 통해 인사이트를 얻습니다.

0개의 댓글

관련 채용 정보