데이터 분석에 대해 공부하며 읽었던 책의 주요 내용을 요약하였다.
<책 정보>
제목: SQL로 분석하고 Tableau로 시각화하자(실무 예제로 익히는 데이터 분석 시각화 테크닉)
출간일자: 2020
저자: 모원서
출판사: 비제이퍼블릭
06 Tableau를 학습하기 전에
01 SQL 이후에, Tableau를 배워야 하는 이유
- 효율성 + 생산성 + 공유성
- Tableau는 데이터 시각화 방식인 R, Python 또는 SQL → Excel → PPT와 비교하였을 때, 작업 시간 대비 높은 효율성 및 생산성을 자랑할 뿐만 아니라 데이터 실시간 공유가 가능함
07 기본에 충실한 Tableau
01 Tableau 제품 구성
- Tableau Prep(데이터 전처리) → Tableau Desktop(데이터 시각화) → Tableau Server/Online(대시보드 공유 및 데이터 관리)
02 Tableau 기본 개념
- 차원: 분류적인 데이터(ex. Gender, Brand, Store Addr 등)
- 측정값: 집계적인 데이터(ex. Quantity, Price 등)
- 연속형: 무한한 값인 측정값의 기본 형식(ex. Quantity, Price 등)
- 불연속형: 유한한 값인 차원의 기본 형식(ex. Gender, Brand, Store Addr 등)
03 Tableau 데이터 시각화 작업 순서
- 데이터 원본 연결 → 워크시트 작업 → 대시보드 구성 → 스토리 만들기
08 데이터 시각화에 필요한 Tableau
01 필터
- 데이터 원본 필터: 연결된 원본 데이터에 필터 적용. 데이터를 불러오는 단계에서 필터되기 때문에 대용량 데이터를 불러올 때 유용함
- 워크시트 필터: [차원] 및 [측정값] 필드를 통해 워크시트 뷰를 필터하는 기능
02 필드 및 뷰
- 필드 변환: [차원] 및 [측정값] 필드를 활용하여 시각화에 필요한 새로운 필드로 변환
- 뷰 편집: 서식 / 축 편집 / 추세선 / 주석 등을 활용해 뷰를 시각적으로 편집
03 마크 카드 및 표현 방식
- 마크 카드: 색상 / 크기 / 레이블 / 세부 정보 / 도구 설명을 활용해 뷰를 시각적으로 표시
- 표현 방식: 선택한 필드 값들을 기준으로 적합한 뷰 추천
04 분석
- 요약: 상수 및 평균 라인 / 사분위수 및 중앙값 / 박스 플롯 / 총계를 활용하여 뷰를 분석적으로 요약
- 모델: 95% CI(Confidence Interval_신뢰구간)의 평균 및 중앙값 / 추세선 / 예측 / 클러스터를 활용해 뷰를 분석적으로 모델화
- 사용자 지정: 참조선 / 참조 및 분포 구간 / 박스 플롯의 사용 가능한 옵션을 지정해 뷰를 분석적으로 요약
09 실무에 필요한 Tableau
01 자주 쓰이는 Tableau 기능
- 퀵 테이블 계산: 데이터 시각화에 필요한 계산식(누계 / 구성 비율 / 순위/ 전년 대비 성장률 등)을 빠르게 적용할 수 있는 Tableau 기능
- 개별 / 단일 / 이중 축: 여러 측정값의 축을 뷰에서 한 번에 보는 Tableau 기능
- 기본 함수: 데이터 시각화에 필요한 Tableau에 내장된 함수. 숫자 / 문자 / 날짜 / 유형 변환 / 논리 / 집계 / 테이블 계산 총 7가지
- LOD(Level of Detail) 함수: 세분화된 측정값을 계산하는 Tableau 기능
LOD 함수 | 설명 | 예 |
---|
Fixed | 지정된 차원을 기준 측정값 집계 | {Fixed [Brand] : SUM([매출액])} |
Include | 지정된 차원 + 뷰 차원 기준 측정값 집계 | {Include [Mem no] : SUM([매출액])} |
Exclude | 지정된 차원이 뷰에 존재하는 경우 제외하여 측정값 집계 | {Exclude [Brand] : SUM([매출액])} |
02 효율화 & 자동화에 필요한 Tableau 기능
- 매개 변수: 숫자 / 날짜 / 문자 등 상수 값이며, 뷰 및 대시보드를 효율적으로 컨트롤하는 Tableau 기능
- 공유: Tableau Server/Online에 뷰 및 대시보드를 자동적으로 게시하는 Tableau 기능
10 Tableau 학습을 마무리하며
01 SQL + Tableau
- 데이터 분석가는 "데이터를 어떻게 활용할 것인가?"라는 질문에 대한 인사이트를 찾아가는 역할 수행
- SQL 기반의 Tableau는 이러한 인사이트를 찾아가는 가장 쉽고 빠른 방법
- 데이터 분석가는 데이터를 근거로 의사결정(Data-driven decision)에 필요한 인사이트를 협업을 통해 찾아내고 공유
- SQL로 개발자 or DBA와 협업하며 Tableau로 경영진 or 실무자에게 새로운 인사이트를 공유