[TIL] Tableau 3 - 4 주차 강의

Donghyun·2024년 9월 3일
0

TIL (Today I Learned)

목록 보기
40/53

텍스트 테이블

✅ 데이터의 형태

  • wide format table
    • wide format table은 옆으로 넓은 형태로 데이터가 쌓인다.
    • 데이터 분석을 할 경우 많이 사용되는 형태로 표를 비교하거나 그래프 시각화 하기 쉽다.
    • 상관 관계를 분석하거나 각 변수의 분포를 비교할 때 적합.
  • long format table
    • long format table은 아래로 쌓이는 긴 데이터셋.
    • 시간에 따른 변화와 카테고리 간 비교를 시각화하기에 적합.
    • 컴퓨터와 태블로가 선호하는 형태.
  • 총계
    • [분석탭]에서 열과 행의 총 합계 및 소계를 표시할 수 있다.

태블로 작동 원리

필터별 작동 원리

출처 - 태블로 공식 홈페이지

  • 추출 필터: 데이터 소스에서 추출된 데이터 필터링(데이터 연결을 추출로 선택했을때만 사용 가능)
  • 데이터 원본 필터: 데이터 원본 소스에서 일부 데이터만 필터링
  • 컨텍스트 필터: 특정값에 대한 데이터만 필터링
  • 차원 필터: 차원을 기준으로 데이터 필터링
  • 측정값 필터: 측정값을 기준으로 데이터 필터링
  • 테이블 계산 필터: 특정 계산 결과를 기준으로 데이터 필터링

계산과 필터의 작동 순서

참고 자료 출처 - Tableau Order of Operations by Dave Weaver


필터 활용법

✅ Top N 필터와 차원 필터

Top N 필터는 차원 필터보다 위에서 먼저 작동되기 때문에 지역별 필터(차원 필터)가 적용되지 않는 문제가 발생. 차원 필터를 먼저 동작시키고 싶다면 어떻게 해결해야 할까?

이때 컨텍스트 필터를 활용해서 해결할 수 있다. 상위 필터, 집합, Fixed식과 차원 필터의 문제들이 발생하는 경우, 컨텍스트 필터를 활용해서 작동 순서를 바꿀 수 있음.

작동 원리 우선 순위: 컨텍스트 필터 > Top N > 차원 필터 


태블로 함수

논리 함수

  • IF
    
    IF SUM([Sales]) >= 10000
     THEN '상위 매출' ELSE '하위 매출' END
  • Case when
    CASE [측정값]
    WHEN 'Sales' THEN [매출]
    WHEN 'Profit' THEN [수익] 
    ...
    END

날짜 함수

  • DATEDIFF 함수: 두 날짜 사이의 차이를 반환
    DATEDIFF(단위, 시작 날짜, 끝 날짜)
  • DATEADD 함수: 날짜 더하기
    DATEADD(단위, 간격, 기준 날짜)

LOD식 활용하기

📍 LOD식(세부 수준 식)이란?

현재 화면(VLOD)에 영향을 받지 않고 원하는 세부 수준에서 값을 계산할 수 있다.

LOD식은 세분화된 수준(INCLUDE), 덜 세분화된 수준(EXCLUDE), 완전히 독립적인 수준(FIXED) 크게 3가지로 나누어진다.

  • LOD식 기본 문법 구조 전체 LOD식은 {}(중괄호)로 묶어줌.
    
    {[FIXED | INCLUDE | EXCLUDE] [차원1], [차원2] : AVG([측정값])}

FIXED

뷰에 있는 차원과 상관없이 계산된 필드에서 FIXED 계산식을 고정시켜 지정된 차원을 계산.

  • 지역별 평균 매출

{ FIXED [Region] : AVG([Sales]) }

INCLUDE

뷰에 지정된 차원 뿐만 아니라 모든 차원을 포함해서 계산

  • 지역별 평균 매출

{ INCLUDE [Region]: AVG([Sales]) }

EXCLUDE

차원을 제거해서 계산합니다.

  • 지역별 평균 매출

{ EXCLUDE [Region]: AVG([Sales]) }

지표 정의 및 선정

📍메트릭 하이라키란?

비즈니스와 프로덕트를 연결하는 지표의 위계 질서 구조

대시보드 설계

대시보드 구성

  • 대시보드 계층 구조화

상단과 하단으로 크게 섹션을 나누어 구성합니다. 상단에는 주요 지표를 배치.

  • Z 패턴

일반적인 대시보드 디자인 레이아웃은 Z패턴에 해당. 대시보드 한 페이지를 볼 때 대시보드 사용자의 눈 초점이 Z 모양을 순서대로 이동하는 패턴을 의미.

📍 왼쪽 상단: 가장 중요한 지표와 그래프

📍 오른쪽 상단: 두번째로 중요한 정보

📍 왼쪽 하단: 세번째로 중요한 정보

📍그외 세부적인 정보: 오른쪽 하단에 배치

대시보드 스케치

대시보드를 작업하기전에 태블로 워크시트, 종이, PPT 등 툴을 활용해서 초안을 스케치. 실무에서 스케치한 대시보드를 데이터팀 혹은 유관 부서와 리뷰하기도 한다!.

전주의적 속성

어떤 것을 보자마자 뇌에서 바로 알아차릴 수 있도록 강조하기 위한 시각화 속성을 말한다. 핵심 정보가 한눈에 파악할 수 있도록 방향, 길이, 너비, 색상 요소들을 활용해서 강조할 수 있다.

컬러 선정

대시보드를 구축할 경우, RGB 색상 및 컬러 조합을 맞추어서 시각화하면 뷰어 관점에서 직관적으로 한눈에 들어오기 쉽다.

  • 일관된 색상(무지개 색상 X) 사용
  • 특정 정보(변수간의 차이, 카테고리 구분 등) 색상 강조

profile
데이터분석 공부 일기~!

0개의 댓글