KDT 데이터 분석가 과정 5주차 (Tableau)

휸하엘레나킴·2021년 8월 18일
0
post-thumbnail
Tableau (21.08.18 - 21.08.20)

Tableau 설치

데이터를 쉽게 보여주기 위해 사용하는 프로그램.
태블로 데스크탑 프로는 유료다.
학생이면 1년간 이용 무료로 이용 가능하다.
또는 2주간 체험판으로 이용 가능하다.

  • 태블로 데스크탑(유료) : 개인PC에 저장. 접속 가능 데이터 원본의 종류가 수십가지. 저장된 데이터 원본 및 샘플 워크북이 있다.
  • 태블로 퍼블릭(무료) : 온라인 계정에 저장. 서버 데이터 접속이 불가하다. 저장된 데이터 원본 및 샘플 워크북이 없다.

Tableau 기본 개념

Tableau 인터페이스 살펴보기

  • Drag and Drop 방식으로 파일을 불러온다.
    (화면 밖으로 빼면 삭제된다.)
  • 데이터가 1000행 이상일 경우, 1000행까지만 먼저 보여줌.
  • 데이터 해석기 : 병합되어 있거나 빈셀 등을 정리해 주는 기능.
  • 라이브 연결 : Direct로 파일을 연결하여 사용.
  • 추출 연결 : 파일을 저장한 후 처리하는 방법. 처리가 빠르며, 오프라인으로도 사용이 가능하다.
  • 대시보드 : 다양한 시트를 조합하여 이용할 수 있다. (한 페이지에 모아서 확인)
  • 스토리 : 시트, 대시보드를 불러와서 만들 수 있다. 파워포인트와 유사한 기능.

Tableau 기본 차트 그리기

태블로 위로 필드를 올리는 방법

  • 측정값을 Drag and Drop으로 올리기. 또는 더블클릭.
  • tableau는 측정값을 필드로 올리면 항상 집계해서 보여준다.
  • 마크 : 데이터 덩어리(차트)의 갯수.
  • 테이블을 색상에 Drag and Drop하면, 색상 변경이 가능하다.(default 색상)
  • 우측의 색상을 더블클릭하면 원하는 색상으로 변경이 가능하다.
  • 우클릭으로 축을 숨기고 나타낼 수 있다.
  • 차원(좌측 상단 리스트) 더블클릭 > 측정값(좌측 하단 리스트) > 표 형태
  • 측정값(좌측 하단 리스트) > 차원(좌측 상단 리스트) > 그래프 형태

서식 정리

  • 상단의 서식 > 통합문서 > 서식 수정
  • 필드에서 우클릭 > 서식 수정
  • 하단 sheet 우클릭 > 서식 복사 > 붙여넣기를 통해 sheet의 서식 통일 가능

날짜 필드 화면에 올리기

  • 좌측 테이블명의 아이콘에서 데이터의 특성을 확인할 수 있다. 불러오기가 되지 않을 경우 해당 아이콘을 우클릭하여 변경하여 사용할 수 있다.
  • 열과 행에 올라온 데이터 색상의 의미 : 파란색 - 불연속형 / 초록색 - 연속형
  • option을 누른 상태로 데이터를 필드로 끌어다 두면 어떤 형식으로 필드를 놓겠는지 알림창이 뜬다. 연속형 불연속형을 선택할 수 있다.(mac기준)

라인차트 Vs 영역차트

  • 라인차트는 개별로 값을 표현하고 있으며, 영역차트의 경우 누적된 값을 표현해준다. (누적값을 빼려면 상단의 분석>마크누적>해제)
  • 그리기 : 행에 동일한 측정값을 넣는다 > 좌측 '마크'에서 선/영역을 선택한다.

차트 그리기

Tableau 비율 차트 그리기

파이 차트(from scratch & 표현방식)

  • 카테고리 별 매출 분포 표현 방법.
  1. 열 : 카테고리 / 행 : sales > 좌측 '마크'에서 파이 차트 선택 > 열 값을 색상으로 drop > 행의 값을 각도로 drop
    좌측 테이블에서 카테고리 값을 '마크'의 레이블에 drop하면 그래프에 범례를 레이블링 할 수 있다.
    퀵 테이블 계산 : 좌측 '마크'에서 해당하는 데이터를 선택 > 퀵 테이블 계산 선택
  2. 차트를 그리고자 하는 필드를 동시에 클릭(with. command) > 우측 상단의 표현방식에서 활성화 된(색이 들어온) 차트 중 원하는 것을 선택.

파이 차트의 약점

각도를 통해 비율은 알 수 있다. 그러나 길이를 통해 차트(비율 바 차트 : 바 차트에서 퀵 테이블 사용)를 그리는 것이 한눈에 들어오기 때문에 파이 차트는 아주 좋은 차트라 할 수 없다.

마크 카드에 대한 이해

사용하고자 하는(sales) 값을 열에 올리고 카테고리를 '마크'에 올려서 다양한 방식으로 비율을 확인할 수 있다. (파이 차트의 단점을 보완할 수 있다.)


상관관계 및 분포 차트 그리기

스캐터 플랏

  • 기본적으로 tableau는 필드를 합계하여 집계한다. 따라서 데이터의 속성에 따라 값을 변경해주어 사용한다.
  • 세부정보에 확인하고자 하는 카테고리를 drop하여 수치값 사이의 전반적인 경향성을 확인할 수 있다.
  • 경향성을 선명하게 보여주기 위한 추세선 그리기 : 좌측의 '분석' 선택 > 추세선을 drag and drop.

박스 플랏

  • 차트를 그리고자 하는 필드를 동시에 클릭(with. command) > 카테고리별로 확인하기 위해 열에 카테고리 drag and drop
  • 박스 내에서 우클릭 > 편집 > 기초 마크 숨기기 : 이상치만 확인할 수 있다.

히스토그램

  • % 범위 조절하기 : 올리고자 하는 측정값에서 우클릭 > 만들기 > 구간차원 > 원하는 값을 기재한 뒤, 올리기 (값을 수정할 때는 우클릭 > 편집)

하이라이트 테이블

  • 엑셀의 형식과 같으며, 색을 통해 숫자를 시각적으로 이해할 수 있다.
  • 비즈니스 대시보드에 많이 사용한다.
  1. 표에 들어갈 값을 중앙으로 drag and drop > 행/열에 기준 값을 drag and drop > 표의 값을 '마크' 색깔에 drag and drop ('마크'에서 사각형을 선택해 표에 색 넣기)
  2. 그리고자 하는 필드를 동시에 클릭(with. command) > 우측 상단의 표현방식에서 활성화 된(색이 들어온) 차트 중 원하는 것을 선택.

대시보드

  • drag and drop으로 내가 만든 시트를 한데 모을 수 있다.
  • 차트를 모은 후, 오른쪽 화살표를 눌러 '컨텐츠 균등 분할'을 하면 동일하게 차트 분할을 할 수 있다. (크기가 변해도 각각의 차트 사이즈가 동일한 비율로 움직인다.)

이미지 넣기

  • 바둑판식의 경우에는 구획이 나눠져 있어 이미지(로고 등)를 원하는 위치에 넣는 것이 어렵다.
  • 차트 편집 후, 부동 방식으로 변경 후에 넣을 수 있다. 또는 바둑판식 때, 컨테이너를 넣어 이미지를 집어 넣는다.

구분선 넣기

  • 구분선 기능이 따로 없다.
  • 왼쪽 대시보드 > 개체 > 빈페이지 drag and drop > 레이아웃 > 백그라드, 원하는 색으로 지정 > 높이 조정

Tableau 핵심 개념

차원과 측정값

  • tableau에서 측정값(measure) : 우리의 괌심을 받는 대상 그 자체.
    학급 학생들의 키를 분석하자 : 키
    회사 매출액을 검토하자 : 매출액
  • tableau에서 차원(dimension) : 우리가 관심을 가지고 있는 측정값을 어떻게 썰어서 볼 것인가.
    학급 학생들의 남자와 여자 즉, 성별을 기준으로 키를 분석할거야 : 차원-성별, 측정값-키
    회사 매출액을 월별로 검토할거야 : 차원-월, 측정값-매출액

연속형과 불연속형

  • 연속형 : 쭉 이어진 것(초록색) - 색상을 넣었을 때 그라데이션으로 보여짐.
  • 불연속형 : 잘려서 구분되는 것(파란색) - 색상을 넣었을 때 각각의 색으로 보여짐.
  • option을 누르고 drop and drag를 하면 바로 연속형, 불연속형을 선택하여 올릴 수 있다.

Level of Detail

  • tableau는 집계(나열된 숫자들을 계산)하여 보여준다.
  • 잘 썰어서 즉, 원하는 내용을 잘 배치하여 다양한 방식으로 차트를 그릴 수 있다. 얼마나 크게 자를 것인지, 잘게 자를 것인지 생각해야한다.
  • 차원이 level of detail에 영향을 미친다. 측정값은 영향이 없다.

네 가지 계산

  • 행(row) 수준 / 집계(aggregaiton) 계산
    • '계산된 필드 만들기'를 통해서 drag and drop을 할 수 있다.
    • 계산의 순서가 중요. 더하기, 빼기는 순서가 상관 없다. 나누기, 곱셈을 할 때 유의할 것.
  • 테이블 계산
    • 집계 계산 이후에 이루어진다.
    • '마크'의 데이터에서 우클릭 > 퀵 테이블 계산
  • LOD 표현식
    • 선택한 카테고리 레벨에서 내가 원하는 것을 계산하여 표현함.

대시보드와 스토리

  • 바둑판식 방식 Vs 부동 방식
    • 바둑판식 : 정해진 공간을 채워가며 만드는 방식.
    • 부동 : 시트를 겹치게 사용할 수 있다. 정밀하게 시트 위치를 옮길 수 있다.(손이 많이 간다)
  • 주요개체
    • 개체를 바탕으로 컨테이너 생성, 시트를 채워 넣을 수 있다.
    • 컨테이너를 사용하면 시트 사이즈 비율을 조절하기 쉽다.
  • 필터 액션 설정
    • 해당 화면에서 같은 내용으로 필터를 걸어 한눈에 확인할 수 있다. 원하는 년도 확인하기
  • 스토리
    • 파워포인트와 같은 기능.
    • 대시보드를 그대로 넣을 수도 있다.
    • 상단 대시보드 클릭 > 동작 > 동작 추가 > 하이라이트 액션
      • 필터링된 값 유지 : 필터 걸린 그대로 다시 복구 불가
      • 모든 값 표시 : 다시 누르면 원상 복구 가능
      • 모든 값 제외 : 클릭 후 하나씩 내용이 지워짐
profile
문과생의 데이터 분석 공부

0개의 댓글