Tableau 소개
-
학습을 위한 public 버젼(무료)이 있다. 해당 버젼을 기준으로 소개를 진행한다
-
CSV 파일만 지원한다. 즉, 데이터에 대한 라이브 연결은 지원하지 않는다
-
자신이 만든 대시보드는 기본적으로 모든 사람들에게 공개된다 -> 포트폴리오로 사용 가능하다
-
Tableau의 용어 설명
- Dimension(차원) :
- 정성적 데이터로 일반적으로 차트의 X축 (Columns)에 배치된다
- 데이터를 세분화, 분류하는데 사용되는 카테고리 필드
- Dimension을 사용하여 그룹핑, 필터링을 수행한다
- ex) 제품 이름, 날짜, 지역, 연령대, 부서, etc
- Measures(측정값)
- 정량적 데이터로 일반적으로 Y축 (Rows)에 배치된다
- ex) 매출액, 사용자수, 온도 판독값 등의 연속적인 숫자
Tableau로 WAU 차트 만들기
-
WAU의 경우 X축은 Week Number (Dimension), Y축은 Active User Count (Measures)로 설정해준다
-
"user_session_summary.csv"파일을 Tableau Public 데스크탑으로 import 해준다
- Tableau가 간단한 분석을 진행하여 아래와 같은 요약을 보여준다
- Tableau가 Measures와 Dimension을 사용자가 원하지 않는 형태로 분류하는 경우 Worksheet에서 Drag & Drop으로 조정해주면 된다
![](https://velog.velcdn.com/images/watermelon870/post/10521b73-0674-4f2b-b6a0-27f6997cd231/image.png)
- 멀티라인 WAU 차트 생성
- "Marks"에 Channel(일종의 필터)을 추가한다
![](https://velog.velcdn.com/images/watermelon870/post/7ef9ab37-b959-405a-b6c7-916ad643387d/image.png)
- 가시성을 높이기 위해 Channel별로 색상을 다르게 추가해준다
- "Marks"에 추가된 "Channel"을 "Marks"의 "Color"로 drag and drop 해준다
![](https://velog.velcdn.com/images/watermelon870/post/4f65bcef-ae9b-4e8b-89e7-9d3fb51d6ee2/image.png)
- 마지막으로 차트 / X축 / Y축의 이름을 변경한다.
- 차트의 이름은 좌측 상단의 "Sheet 1"을 더블클릭하여 수정 가능하다
- X축(Cols)의 경우는 좌측에 "Tables"에서 사용한 항목을 Duplicate한 후 Rename 해주고, 새롭게 "Columns"에 추가해준다
- Duplicate를 하지 않고 Rename하는 경우 원래 존재하는 field가 사라지기 때문에 주의!
- Y축(Rows)의 경우 "COUNTD([Userid])"로 정의되어 있기 때문에, 이를 원하는 이름의 새로운 Calculated Field로 생성해준다
![](https://velog.velcdn.com/images/watermelon870/post/b5b89c21-c78f-400a-bab1-c96d289e1315/image.png)
Tableau로 Cohort 차트 만들기
-
Cohort의 경우 X축은 (Visited Month - Cohort Month), Y축은 Cohort Month로, 차트의 내용은 Active User Count로 설정해준다
-
"cohort_summary.csv"파일을 Tableau Public 데스크탑으로 import 해준다
-
Calculated Field를 사용하여 Cohort 차트 생성
- visited_month_num : cohort_month와 visited_month의 차이를 계산하여 col으로 설정
# datediff 함수로 두 Date간의 차이를 구한다. 이때, 달 단위의 차이를 구한다
datediff('month', [Cohort Month], [Visited Month])
![](https://velog.velcdn.com/images/watermelon870/post/f8cba004-2154-473d-933c-6b8360c3a3ee/image.png)
대시보드를 생성하고 필터 추가해보기
-
Tableau의 Worksheet, Dashboard, Story
- Worksheet : 지금까지 만든 WAU, Cohort와 같은 하나의 차트로 구성
- Dashboard : 하나 이상의 차트로 구성
- Story : PPT 슬라이드와 비슷. 각 slide에 하나의 (차트 / 대시보드)로 구성되며 캡션 및 주석을 추가할 수 있다
![](https://velog.velcdn.com/images/watermelon870/post/2c71a3db-85fb-48f4-9433-ec2f39d07e4a/image.png)
-
WAU와 Cohort 차트를 묶어서 대시보드 생성
- 만들어 놓은 Sheet들이 좌측에 정렬되어 있다. Drag & Drop으로 Dashboard에 추가 가능
![](https://velog.velcdn.com/images/watermelon870/post/209aa984-cda7-494c-b1de-0719331a4366/image.png)
- Tableau Public에 저장하기
- File -> Save to Tableau Public || control + s로 저장 가능
- 결과물 확인 링크
- Private하게 공유하고 싶은 경우 : 공유 버튼을 클릭하면 Embeded || Link 공유를 진행 할 수 있다
![](https://velog.velcdn.com/images/watermelon870/post/2c7ee8b9-3d40-4e1f-ab5d-71e2a775fe38/image.png)
10주차 강의 정리
- 데이터 웨어하우스, 데이터 레이크, ETL, ELT의 개념을 기억해야 한다
- Snowflake를 AWS와 연결하여 사용해본다
- 좋은 지표의 조건 및 다양한 도메인에서 사용되는 대표적인 지표를 이해한다
- Superset을 사용해 본다
- Tableau를 사용해 본다