다양한 시각화 툴 소개
대시보드, 혹은 BI(Business Intelligence) 툴이라고 부르기도 한다
중요한 데이터 포인트들(KPI, 각종 지표)를 계산/분석/시각화 해주는 도구
Excel, Google Spreadsheet : 가장 많이 사용되며 가장 쉬운 시각화 툴
Python : EDA에 더 적합함
Power BI
Apache Superset
AWS Quicksight
Looker
Tableau
ReDash
Mode Analytics
보통 Looker / Tableau를 많이 사용한다
데이터 민주화(self-service dashboard) 관점에서 봤을때는 Looker가 승리
Superset 소개
Google Spreadsheet로 시각화 연습해보기
저번 시간에 사용한 Snowflake에서 "COHORT_SUMMARY"라는 테이블을 만들어준다.

새로운 worksheet를 사용해 원하는 형태를 갖는 csv파일로 만들어 준 뒤 다운받는다.

Spreadsheet에서 해당 데이터를 pivot table로 시각화 해준다.

Superset 실습 준비 (Docker 설치 및 Redshift 연결 설정)
실습을 진행할 Table은 아래와 같다
Docker를 이용하여 설치하는 방법과 Preset.io에 있는 서비스로 사용하는 방법이 있다.
Preset.io의 경우는 회사 이메일이 있는 경우에만 사용 가능하기 때문에, Docker로 실습 진행
MAU 차트 만들어 보기
우선 실습용 Redshift DB에 연결한다

필요한 Dataset을 추가해준다

Superset에서 사용 가능한 차트의 종류는 아래와 같이 다양하다

line chart를 사용하여 MAU 차트를 만들어보자

dimension (채널)을 추가한 차트는 아래와 같다

Cohort 차트 만들어 보고 Dashboard 만들어 보기
필요한 데이터셋을 추가한 후 pivot chart를 만들어준다

앞에서 만든 MAU 차트 및 Cohort 차트로 하나의 DashBoard를 만든다
