[DevCourse] 10-5 Tableau 배워보기

한상우·2024년 1월 26일
0

Data Science Devcourse

목록 보기
19/25

Tableau 소개

  • 학습을 위한 public 버젼(무료)이 있다. 해당 버젼을 기준으로 소개를 진행한다

  • CSV 파일만 지원한다. 즉, 데이터에 대한 라이브 연결은 지원하지 않는다

  • 자신이 만든 대시보드는 기본적으로 모든 사람들에게 공개된다 -> 포트폴리오로 사용 가능하다

  • Tableau의 용어 설명

    • Dimension(차원) :
      • 정성적 데이터로 일반적으로 차트의 X축 (Columns)에 배치된다
      • 데이터를 세분화, 분류하는데 사용되는 카테고리 필드
      • Dimension을 사용하여 그룹핑, 필터링을 수행한다
      • ex) 제품 이름, 날짜, 지역, 연령대, 부서, etc
    • Measures(측정값)
      • 정량적 데이터로 일반적으로 Y축 (Rows)에 배치된다
      • ex) 매출액, 사용자수, 온도 판독값 등의 연속적인 숫자

Tableau로 WAU 차트 만들기

  • WAU의 경우 X축은 Week Number (Dimension), Y축은 Active User Count (Measures)로 설정해준다

  • "user_session_summary.csv"파일을 Tableau Public 데스크탑으로 import 해준다

    • Tableau가 간단한 분석을 진행하여 아래와 같은 요약을 보여준다
    • Tableau가 Measures와 Dimension을 사용자가 원하지 않는 형태로 분류하는 경우 Worksheet에서 Drag & Drop으로 조정해주면 된다

  • 멀티라인 WAU 차트 생성
    • "Marks"에 Channel(일종의 필터)을 추가한다

  • 가시성을 높이기 위해 Channel별로 색상을 다르게 추가해준다
    • "Marks"에 추가된 "Channel"을 "Marks"의 "Color"로 drag and drop 해준다

  • 마지막으로 차트 / X축 / Y축의 이름을 변경한다.
    • 차트의 이름은 좌측 상단의 "Sheet 1"을 더블클릭하여 수정 가능하다
    • X축(Cols)의 경우는 좌측에 "Tables"에서 사용한 항목을 Duplicate한 후 Rename 해주고, 새롭게 "Columns"에 추가해준다
      • Duplicate를 하지 않고 Rename하는 경우 원래 존재하는 field가 사라지기 때문에 주의!
    • Y축(Rows)의 경우 "COUNTD([Userid])"로 정의되어 있기 때문에, 이를 원하는 이름의 새로운 Calculated Field로 생성해준다

Tableau로 Cohort 차트 만들기

  • Cohort의 경우 X축은 (Visited Month - Cohort Month), Y축은 Cohort Month로, 차트의 내용은 Active User Count로 설정해준다

  • "cohort_summary.csv"파일을 Tableau Public 데스크탑으로 import 해준다

  • Calculated Field를 사용하여 Cohort 차트 생성

    • visited_month_num : cohort_month와 visited_month의 차이를 계산하여 col으로 설정
# datediff 함수로 두 Date간의 차이를 구한다. 이때, 달 단위의 차이를 구한다
datediff('month', [Cohort Month], [Visited Month])

대시보드를 생성하고 필터 추가해보기

  • Tableau의 Worksheet, Dashboard, Story

    • Worksheet : 지금까지 만든 WAU, Cohort와 같은 하나의 차트로 구성
    • Dashboard : 하나 이상의 차트로 구성
    • Story : PPT 슬라이드와 비슷. 각 slide에 하나의 (차트 / 대시보드)로 구성되며 캡션 및 주석을 추가할 수 있다
  • WAU와 Cohort 차트를 묶어서 대시보드 생성

    • 만들어 놓은 Sheet들이 좌측에 정렬되어 있다. Drag & Drop으로 Dashboard에 추가 가능
  • Tableau Public에 저장하기
  • Private하게 공유하고 싶은 경우 : 공유 버튼을 클릭하면 Embeded || Link 공유를 진행 할 수 있다

10주차 강의 정리

  • 데이터 웨어하우스, 데이터 레이크, ETL, ELT의 개념을 기억해야 한다
  • Snowflake를 AWS와 연결하여 사용해본다
  • 좋은 지표의 조건 및 다양한 도메인에서 사용되는 대표적인 지표를 이해한다
  • Superset을 사용해 본다
  • Tableau를 사용해 본다
profile
개인 공부용 블로그입니다

0개의 댓글

관련 채용 정보