[2023.12.13] Tableau

하은·2023년 12월 13일
0

DATA LITERACY - 데이터를 보고 활용할 수 있느 능력. 탐색을 통해 이해하고, 통찰하는 능력. 구성원들이 데이터에 쉽게 접근할 수 있도록

  • 데이터 시각화
    : 데이터에 색상, 모양, 사람들의 시선을 끌 수 있는 요소를 배치해 데이터를 효과적이고 직관적으로 표현하는 것.
    = 전달하고자 하는 메시지를 정하고 불필요한 부분은 생략
  • 테블로: 데이터를 시각화 및 분석하는 솔루션.
    : 데이터를 보고, 이해할 수 있도록 돕고자 만들어짐.
    : 장점
    - 유연한 데이터 연결
    - 직관적인 drag & drop 인터페이스
    - 다양한 형태의 시각화
    - 디지털 노마드에 최적화
  • BI(Business Intelligence): 기업에서 데이터를 수집, 정리, 분석, 활용해 효율적인 의사결정을 하도록 하는 애플리케이션과 기술의 집합

  • 데이터 결합
    *UNION
    설명: 한 테이블의 행을 다른 테이블에 추가해, 두개 이상의테이블을 결합가능.
    방법: 테이블을 지정해 데이터를 끌고옴 UNION이란 옵션이 나타남.
    유의: 원하는 결합을 하려면, 결합하는 테이블의 구조가 같아야 함. 필드 수, 이름, 유형이 일치해야함.
    확인: 마우스 우클릭 - 유니온 편집 - 테이블 확인 가능

*JOIN
설명: 로지컬 테이블에서 새로운 테이블을 끌어다 놓으면 관계가 형성됨.
더블 클릭해서 피지컬 테이블 화면에 끌어와서 JOIN해줘야 함.
다이어그램이 형성됨. 조인 유형 변경 가능.
같은 피드명이 존재하면 KEY값을 잡아줌
확인: 데이터 그리드에서 확인가능하고, 추가된 필드는 맨 오른 쪽에서 확인가능

로지컬 테이블: 각 시트 및 테이블간의 관계만 설정. 공동된 필드로 관련방식설명. 테이블을 하나로 병합하지는 않음. 테이블은 각 분리되며 고유한 상태를 유지함. 관계형성은 두 테이블 간의 약속. 약속에 따라 데이터를 가져온 후 적절한 JOIN쿼리를 작성.
결론: JOIN과 관계는 큰 차이가 있다. 데이터를 물리적으로 병합해서 하나의 테이블로 만든ㄴ 것/ 물리적으로 결합하지는 않음.

  • 편집
    1) 데이터 필드명 변경
    F1, F2 혹은 직관적이지 않은 경우, 누구나 이해가능하게 변경
    메타 데이터 목록을 통해 원격필드에서는 원본이 어떻게 있었는지 추적해볼 수 있음
    2) 데이터 타입 변경
    날짜 타입 -> 문자 타입 등 변경가능.
    3) 필터
    데이터원본에 필터를 적용해 분석에 필요하지 않은 범위에 대해 축소하면, 속도 향상시킬 수 있음. = 전처리
    *오른쪽 상단 필터 - 추가 - 추가 - 필터하고자하는 필드 선택 - 항목선택 - 확인 - 확인
    : 날짜 : 이벤트 성과 등 확인 시
    : 매출 등 측정값 = SALES

  • 인터페이스
    1) 우측 하단 '새로운 시트 만들기'
    2) 좌측 데이터 목록= 필드
    상단영역: 차원 / 하단영역: 측정값
    더블클릭하면, 추천하는 그래프 형식으로 뜸.
    3) 시각화
    마크 영역을 사용 혹은 우측 '표현방식'
    4) 하단 시트 영역
    생성, 원본으로 돌아감 등이 가능


데이터를 끌어다놓으면 성격에 따라 차원/측정값으로 자동분류됨
드래그해서 속성변경 가능.
= 집계된 측정값을 원하는 차원레벨에 맞춰 잘라서 볼 수 있음.

  • 차원
    = 정상적인 값. 이름, 날짜, 지리적 데이터 포함.
    = 데이터의 세부정보 나눠 분류가능

  • 측정값
    = 집계가 가능하거나 필요할 수 있는 데이터
    = 숫자로 구성

  • 더블클릭 또는, 드래그 해서 상단에 놓을 때
    = 차트 생성

  • 뷰 영역으로 드래그 했을 때
    = 집계된 결과값 생성. 마크카드 옵션에서 텍스트를 가지게 됨.

  • 예)
    -세일즈 측정값: 뷰 영역 - 드래그
    -카테고리 차원필드: 더블클릭
    -->세일즈 데이터가 카테고리 항목만큼 분할돼서 표시
    -오더데이트 차원값: 카테고리 옆에 드래그
    --> 연도별 각 카테고리의 매출값이 집계
    -필드 앞 +버튼 누르면 하위단계로 내려가서 드릴다운 분석이 가능

  • 예) 차원과 측정값이 자동배치된 걸 변경
    측정값을 차원으로 옮기고 더블클릭
    -속성변경=고객분석에 많이 사용: 마스터 테이블에는 고객ID등의 고유값만 있어서 차원형태로 인식. 고객수 카운트위해서는 속성변경해야함.


  • 연속형(초록색) / 타이틀이 축으로 생성

  • 불연속형(파란색) / 머릿글로 생성

  • 예)
    SALES와 카테고리를 더블클릭해서 차트 생성
    :파란색 필드(카테고리)에서 우클릭- 서식 - 사이드바가 [머리글] 변경할 수 있게 뜸.
    :초록색 필드(SALES) 좌측 숫자 선택 - 우클릭 - [축]이 표시 됨

  • 예) 날짜타입 = 불연속형으로 구분되지만, 목적에 따라 연속형으로 변경가능
    : SALES 더블클릭, ORDER DATE 더블클릭 - ORDER DATE를 CTRL누른채로 드래그 해서 필터 부분에 놓음 - '년'선택 - '2020'년만 선택 - 점 하나만 보일텐데, +를 눌러서 드릴다운
    -> 불연속으로 뜸
    : 시트 복사본 생성 - 드릴드롭해서 처음으로 돌아옴 - ORDER DATE 우클릭 - '일'형태의 연속형으로 변경
    -> 연속으로 뜸

  • 예) 색상구분
    : 매출, SUB CATEGORY 추가 - 행과 열을 바꿔주고, 내림차순 정렬(상단 아이콘 버튼) - SUB CATEGORY를 CTRL 누르고 '마크'부분의 색상에 놓기 - 각 다른 색상으로 표현됨
    : 연속형 필드(매출)를 색상에 넣음 - 불연속형 필드와 다르게 같은 색상의 그라데이션으로 표현.
    = 색상도 표현방식에 따라 연속형, 불연속형으로 변경가능


기본차트 만들기

- 테이블

  • 텍스트 테이블, 하이라이트 테이블
    : 시각화는 아니지만, 카드지표나 정확한 값이 표현돼야할 때
    : 엑셀에 익숙해진 다른 부서와 대시보드를 공유해서 사용할 때. 단순한 시각화가 훨씬 상대방이 이해하기 좋음.

  • 테이블 생성
    '고객 세그먼트', '매출'을 넣고 '행렬' 바꿔줌
    -CTRL 누르며 '매출'을 '마크 - 색상'에 끌어다 놓음
    -'마크-사각형'으로 바꿔줌. 값이 높은 순으로 색상이 진하게 표현됨
    ('제품 중분류'같이 값 많은 걸 넣어주면 시각화 효과가 두드러짐)

- 막대

  • 막대 테이블
    : 특정 집계에 대한 절대적인 크기를 시각적으로 표현하기에 적합
    : 엑셀이나 PPT에서 많이 사용해 일반적으로 사람들에게 익숙한 차트
    : 단순한 '크기'를 보여주고자 한다면, 막대그래프 활용이 적절

  • 테이블 생성
    '고객 세그먼트', '매출'을 넣음
    *순서에 따라 차트형식이 달라짐
    1) '차원' - '측정값' -> 표 생성
    2) '매출'(측정값) -'고객 세그먼트' (차원)
    = 자동으로 막대차트 생성
    -> 효과적인 시각화 위해 행렬전환 - 내림차순정렬 - 화면 전체보기
    -> 세그먼트 구분을 위해, '고객 세그먼트' 를 '마크-색상'에 넣어줌
    -> 차트 정리를 위해 '마크'에 '매출'을 끌어오고 우클릭 - 서식 - 패널 - 숫자 서식 중 단위를 '사용자 지정' - '디스플레이 패널' 중 '백만'으로 변경 - 맞춤은 가운데 맞춤으로 변경

- 라인

  • 일련의 값에 대한 시간별 추세, 미래값 예측에 유용
    예) 주식: 시간의 흐름에 따른 등락이 중요해서 라인차트 사용
    X축에 시간을 넣어 표현하는게 일반적
  • '시트 생성'-'매출', '주문일자'를 넣음
    '날짜타입'의 '차원'을 넣어서 자동으로 라인차트를 만들어 줌.
    : '월' 레벨까지 드릴다운 - 좀 더 보기 쉽게 '분기'는 빼줌. 잡아서 위로 올려버리면 됨
    -> 연도별 월 트렌드 차트가 만들어짐. 해당월의 매출 확인 위해, '매출'을 '마크- 레이블'에 넣음
    -> 최고점, 최저점만 표시하게 만들어주기 위해, '마크 -레이블' 클릭 - '최대(최소)'를 눌러줌
    -> 연도별 평균매출을 추가해 증가혹은하락을 확인해주고자, 사이드바 '분석' - '평균라인'드래그 해서 화면에 갖고 오면 옵션이 생김 - '패널'수준에서 평균값 구하기로 함.
    -> 마우스 오버를 하면 평균값이 확인되지만, PDF로는 확인 안 되기 때문에, 화면에 표시해주고자 - '평균라인'클릭 - '편집' - '레이블- 사용자 지정' - '계산' 클릭 - '='입력 - '값' 클릭

= 차트나 대시보드를 마무리 하기 전에, 누구와 공유해서 사용할 것인지 생각하고 마무리 하는 게 중요

0개의 댓글