[태블로] 실습으로 배우는 태블로

HEY! MIN·2024년 12월 10일

태블로 차트 소개

표현방식

Tableau 표현 방식 기능은 데이터에 적합한 대표적으로 24개의 그래프를 이용할 수 있다.

기본 그래프

1. 선 그래프(Line Plot)

특징

  • 간단하고 사용하기 쉽습니다.
  • 시계열 데이터(시간에 따른 추이)를 시각화할 경우, 변화량과 트렌드를 한눈에 보기에 용이합니다.
  • 연속적인 데이터에 사용하기 적합합니다. 연속형 데이터는 온도(25도, 30도), 시간(시, 분, 초)를 말합니다.
[실습] 에어비앤비 호스트 수 추이 
연도별(2008-2016년) 에어비앤비 호스트 수 증가 추이를 선 그래프로 시각화해봅시다!

📍 요구 사항
✅ 열: Host Since(년)
✅ 행: 카운트(고유)(Host Id)
✅ 마크 레이블: 표시
✅ 색상: 그래프의 색상을 자유롭게 변경해주세요.
✅ 경로: 라인 패턴 유형을 2번째 선(--)으로 변경해주세요.

2. 막대 그래프(Bar Plot)

특징

  • 간단하고 사용하기 쉽습니다.
  • 범주 간의 차이나 분포를 시각적으로 이해하기 쉽습니다.
  • 범주형 데이터(성별, 혈액형, 이름 등)에 사용하기 적합합니다.
[실습] 동네별 숙소 평균 가격
어느 동네가 숙소 평균 가격이 높을까요? 
neighborhood_cleansed별 평균 가격을 막대 그래프로 시각화 해봅시다!

📍 요구 사항
✅ 색상: 그래프의 색상과 테두리 색상을 자유롭게 변경해주세요.
✅ 정렬: 필드 평균(Price) 내림차순 기준 정렬
✅ 화면 맞춤: 높이 맞추기

3. 맵 차트(Map Chart)

특징

  • 지도를 활용해서 지리적 위치를 살펴볼 수 있습니다.
  • 각 지역별 데이터의 분포 및 비중을 한눈에 확인할때 주로 사용합니다.

[실습] zipcode별 숙소 리뷰 평균 평점 분포
보스턴 지역에서 어느 구역이 숙소 리뷰 평균 평점이 가장 높을까요? 
평균 평점 분포를 맵 차트로 시각화 해봅시다!

📍 요구 사항
✅ 세부정보: Zipcode
✅ 색상: 평균(Review Scores), 색상은 자유롭게 변경해주세요.
✅ 레이블
- Neighbourhood Cleansed: 폰트 볼드 처리, 폰트 크기(10pt)
- 평균(Review Scores)
✅ 백그라운드 레이어:투명도 100%
✅ 도구 설명
- 도구 설명 표시: 마우스 오버

4. 파이 차트(Pie Chart)

특징

  • 각 부분의 크기가 상대적인 비율이기 때문에 각 부분이 전체에서 차지하는 비중을 쉽게 이해할 수 있습니다.
  • 데이터의 구성 비율과 분포를 한눈에 파악할 수 있습니다.
  • 다양한 변수를 다루기에는 적합하지 않을 수 있습니다. 변수가 적을 때 직관적으로 사용하기 용이합니다.
[실습] 룸 타입별 비중
어떤 룸 타입이 가장 많은 비중을 차지하고 있을까요? 
파이차트로 시각화 해봅시다!

📍 요구 사항
✅ 색상: Room Type 색상표에서 연한 번개를 선택해주세요.
✅ 각도: 카운트(고유)(Id)의 퀵테이블 구성 비율
✅ 측정값: 카운트(고유)(Id)
✅ 레이블: Room Type, 측정값을 순서대로 표시해주세요.
- Room Type: 폰트 볼드 처리, 폰트 크기(12pt), 사용자 지정 색상(#4B89DC)
- 측정값: 폰트 볼드 처리, 폰트 크기(10pt)
✅ 화면 맞춤: 전체 보기

5. 트리맵 차트(Treemap Chart)

특징

  • 데이터를 계층적으로 표현하는데 사용됩니다.
  • 카테고리별로 특정 데이터 집합이 전체 데이터에서 차지하는 비율을 면적으로 표현하여 카테고리별 구성 요소를 한눈에 파악할 수 있어요.
[실습] 가장 많이 리스트된 호스트 이름 
가장 많이 리스트된 호스트는 누구일까요? 
호스트의 숙소의 평균 가격과 숙소 가격 합계가 궁금해요. 
숙소 가격 합계가 큰 순서대로 색상을 나타내주세요. 
트리맵 차트로 시각화 해봅시다!

📍 요구 사항
✅ 열: 합계(Host Listings Count)
✅ 행: Host Name
✅ 레이블: Host Name, 평균(Price)
✅ 색상: 합계(Price), 색상 파란색-녹색 단일

6. 스택 플랏(Stacked Plot)

[실습] 일반 호스트와 슈퍼 호스트의 응답 시간별 비중 비교
일반 호스트와 슈퍼 호스트의 응답 시간 비중은 어떻게 다를까요? 
Host Response Time별(1시간내 응답, 몇시간내 응답 등) 슈퍼 호스트와 일반 호스트 수를 
단순 누적 그래프로 시각화 해봅시다!

📍 요구 사항
✅ 색상: 슈퍼 호스트와 일반 호스트 수의 색상을 다르게 표현해주세요. 
색상표에서 여름을 선택해주세요.
✅ 레이블: 마크 레이블 표시
✅ 축: 행 머리글 숨기기
✅ 범례: 표시
✅ 화면 맞춤: 너비 맞추기

데이터 분석 그래프

1. 박스 플랏(Box Plot)

데이터의 분포와 이상치(outlier)를 시각적으로 파악할때 사용하는 그래프입니다.

[실습] 숙박 시설 유형별 가격 분포
property type(숙박 시설 유형)은 주택(House), 게스트 하우스(Guesthouse), 
빌라(Villa) 등이 있어요. 
property type별 가격 분포를 박스 플랏으로 시각화해봅시다!

📍 요구 사항
✅ 색상: 자유롭게 변경해주세요.
✅ 마크: 모양으로 변경해주세요.
✅ 축 편집: y축의 주 눈금선을 고정으로 변경해주세요.
✅ 화면 맞춤: 전체 보기

2. 파레토 차트(Pareto Chart)

📍 파레토 법칙이란?
전체 결과의 80%가 전체 원인의 20%에서 일어난다는 마케팅 기법
(다수의 결과는 소수의 원인에 의해 생겨난다)

3. 상관 관계(Scatter Plot)

지표간 어떤 선형적인 관계가 있는지 알아보기 위해 상관 분석을 자주 활용합니다.

4. 시계열 예측

태블로에서 지수 평활법(exponential smoothing)을 활용해서 예측 모델링을 합니다. 과거 데이터에 기반하여 미래를 예측하는 시계열 예측을 합니다.

[실습] 일별 에어비앤비 매출 예측하기
calender.csv는 2016/9/6부터 2017/9/4까지 일별 전체 매출 실적 데이터입니다. 
실제 값을 바탕으로 2017/9/5 - 2017/9/16 매출을 예측해봅시다!

📍 요구 사항
✅ 표현 방식: 라인 그래프
✅ 예측: 예측 표시
✅ 색상: 색상표에서 천사의 돌을 선택해주세요.
✅ 레이블: 선 끝 레이블 지정
✅ 범례: 숨기기
✅ 워크시트 서식: 채우기 색상을 자유롭게 변경해주세요.

그 외의 그래프

1-1. 도넛 차트(Donut Chart)

특징

  • 파이 차트와 비슷한 형태로 가운데 구멍이 뚫린 경우를 도넛 차트라고 불립니다.
  • 각 부분의 크기가 상대적인 비율이기 때문에 각 부분이 전체에서 차지하는 비중을 쉽게 이해할 수 있습니다.
  • 태블로에서는 대시보드의 KPI 카드로 많이 활용됩니다.

1-2. 히트맵 차트(Heatmap Chart)


특징

  • 색상을 활용해서 데이터 값을 시각적으로 강조할 수 있어요. 색상의 그라데이션을 통해 측정값들을 한눈에 비교할 수 있습니다.
  • 태블로에서 하이라이트 테이블이라고도 불립니다.

1-3. 영역 차트(Area Chart)


특징

  • 영역 차트는 선 아래 영역을 색으로 채워서 데이터의 영역 크기를 파악할 수 있어요.
  • 시간에 따른 데이터의 추이를 시각적으로 나타냅니다. 데이터의 변화 및 흐름을 쉽게 파악할 수 있습니다.

시각화 level up!

1-1. 이중 축(콤보 차트)


특징

  • 이중 축 차트를 사용하면 두 가지 서로 다른 데이터 집합을 한번에 비교할 수 있어요.
  • 축에 서로 다른 단위나 기준을 가지고 있는 경우, 그래프를 볼때 한눈에 알아보기 어렵습니다.

1-2. 평균선/참조선

  • 분석 패널에서 평균선 라인/상수 라인/참조선을 추가해서 의사결정을 빠르게 할 수 있습니다.
profile
It's a, it's the Pleasure Shop

0개의 댓글