Tableau

솔비·2024년 4월 16일
0

📈 Tableau

목록 보기
1/6

Tableau 인터페이스


1) 데이터원본창

- 결합

  • 여러 테이블에서 데이터를 결합
  • 태블로가 적절한 조인을 자동으로 만들기 때문에 조인유형을 선택할 필요가 없음.
  • 조인과 달리 단일 테이블로 병합되지 않고
    각 테이블을 유지하기 때문에 집계 값이 중복되지 않음

-이름 바꾸기

필드 이름 바꾸기 가능

-값 복사

선택한 값을 클립보드에 복사

-숨기기

전체 열 (컬럼) 을 숨기기

-별칭

차원 안에 있는 각 멤버들에 새로운 이름을 부여함

-계산된 필드 만들기

선택한 필드로 새 필드를 만들 수 있음

-그룹 만들기

서로 다른 차원 멤버들을 그룹지어줌 (퀵 데이터 정리)

-분할

태블로가 알아서 적절하게 분할해 여러개 열로 나누어줌

-사용자 지정 분할

분할과 똑같지만 내가 직접 분할 기준 설정 가능

-피벗

가로로 길게 늘어진 열을 세로로 (한 원본에 피벗 한번 가능)

-설명

필드에 대한 추가적인 정보

2) 워크시트 화면





Tableau 기본차트


- Scatter Plot

X축은 판매수익 Y축은 순이익의 합을 나타내고
segment를 색상으로 넣어 segment별 scatter를 찍은 후
고객이름을 세부정보에 넣어
결론적으로 고객별 판매수익, 순이익 scatter를 segment로 색구분하는 Scatter Plot을 만들었다.

- Line Char

4개년도 카테고리별 매출합계를 라인차트로 만들었다.

- Bar Char

카테고리별 이익을 라인차트로 그렸다.
그때, 음수의 값만 다른색으로 강조하였는데,

색을 다르게 할 bar를 드래그한 뒤 클립모양을 클릭해 그룹화 시켜주고 색상범례에서 색상을 변경해주면 된다.

가로bar로 변경하고싶을 때는 위 목록에서 행열변경, 수치입력을 하고자할때는 마크레이블을 클릭힌다.

- Map

step1 이미지의 계층의 경우
계층으로 만들 목록을 드래그드랍하여 계층생성을 할 수 있다.
📌map차트 만들 때 꼭 계층으로 되어있어야함





Tableau 핵심개념


1) 차원과 측정값

  • 차원 : 나눠서 볼 기준 (지역별, 연도별, 성별)
    📌 즉, 숫자를 자르는 기준 (범주형데이터)
  • 측정값 : 값 (매출, 수익, 배송비)
    📌 숫자 (수치형데이터)

더했을 때 말이 안되면 차원(ex : 날짜, 이름,id)
말이 되면 측정값 (ex:매출)

☑️ 측정값은 집계된다 (합계, 평균, 최소, 최대 ...)
☑️ 차원이 없으면 쪼개지지 않고 일단 하나의 덩어리가 된다.
☑️ 차원을 추가하면 뷰의 세부수준 (쪼개지는 정도)가 영향을 받는다.

2) 연속형과 불연속형

위 이미지에서
파란색 = 불연속형 = 개별적으로 구분되는데이터
초록색 = 연속형 = 순서가 있는 이어진데이터

날짜데이터로 예시를 들어보면,

order date를 우클릭(max의경우 옵션키)으로 열에 놓으면
연속형, 불연속형을 선택할 수 있는데,


➡️ 연속형의 경우 시간의흐름, 순서가 있는 월의 흐름에 대한 시각화이고

➡️ 불연속형의 경우 데이터 셋에 있는 4개 년도의 월별 매출 총 합계를 나타내는 시각화이다. (그래서 라인차트를 사용하면 안된다)

📌차이점으로는

  • 불연속형은 : 머리글 (Header)
    • 즉, 하나하나의 항목이므로
    • 정렬이 가능하다.
    • 순서를 바꿀 수 있다면 불연속형이라고 볼 수 있다.
      (ex: id, 이름, 제품명)
  • 연속형은 : 축 (Axis)
    • 즉, 연속된 순서가 있어서
    • 정렬이 불가능하다
    • 순서를 못바꾸면 연속형이다. (ex: 매출, 키)





마크


1) 마크타입

여러 시각화를 고를 수 있다.
태블로에서 자동적으로 선택되어지나
잘못된 마크타입을 선택해도 막지는 않는다.
ex) 라인그래프는 시간에 따른 흐름을 나타낼 때 쓰여야함

2) 색상

색상을 변경하거나
추가 세부사항을 색상에 추가하여 구분할 수 있다.

3) 크기

크기도 마찬가지로 하나의 항목을 추가로 구분지어 시각화 할 수 있다.
위 사진의 예시는 수량을 많이 구매했을 수록 원의 크기를 키워준다.

4) 레이블

시각화에 텍스트나 수치를 입력할 수 있다.
위 이미지 처럼 사용자편집이 가능하고,

위 이미지 처럼 특정 구간만 마크되도록 설정이 가능하다.

5) 도구설명

마우스를 올린 마크에 설명이 뜨는 서식을 설정한다.

6) 세부정보

뷰의 세부수준을 결정하는 마크카드
해당 위치에 차원을 추가하면 뷰의 세부 수준 (쪼개지는 정도)가 영향을 받음
👉 Visualization Level of Detail





태블로 집계방식



태블로에서 모든 측정값은 “집계” 된다
평균, 합계, 카운트, 최대값, 최소값 등등 여러 개의 행을 모아 계산하는 것
집계가 되지 않은 측정값은 집계 방식을 선택해야 함





시각화 전 데이터탐색


1.데이터 보기
2.필드 설명 보기
3.차원과 측정값 분류
4.기본 속성 조정하기
5.레코드 수 확인하기





태블로의 데이터 전처리


- 데이터 관계 특징

1.두 테이블 간의 관계를 설정하지만, 하나의 테이블이 되지는 않음
2.조인 유형을 선택할 필요 없음 (자동으로 가장 적절한 조인을 만듦)
3.모든 행 및 열 데이터를 사용할 수 있음
4.집계 값이 중복되지 않음

📌 조인이 필요할 경우 테이블을 더블클릭한 뒤 조인한 테이블을 끌어오면 된다.

- 관계설정 시 추가사항

만약

위 2개 테이블을 연결하고 싶을 때
계산편집에 들어가서


이미지와 같이 위아래를 같게하여 관계를 설정할 수도 있다.

- 유니온

유니온 시 주의점
1.같은 데이터 연결 타입 이어야 함
2.모든 테이블에서 필드명과 데이터 타입이 같아야 함

- 데이터 Shaping

이미지와 같이 분석하기 힘든 excel을 태블로로 가져와서 전처리 할경우

1. 데이터 해석기를 통한 태블로 자체 전처리 : 제목, 빈 셀 인식 후 태블로에 적합한 데이터로 바꿔줌

2. 길게 늘어진 데이터를 자체 피벗처리
(전체 shift로 클릭 후 우측상단 화살표 -> 피벗)


3. 계산된 필드 만들기로 데이터 정리
replace , + str()등 파이썬 메서드와 유사

태블로의 기본적인 데이터 변형 기능

1.데이터 타입 변경
2.필드명 수정
3.새로운 계산된 필드 생성
4.Pivot (가로로 긴 데이터를 세로로 길게)
5.Split (분할)
6.데이터 정렬


패스트캠퍼스 그로스 리더와 세계 3등에게 배우는 13개 데이터 분석 프로젝트
Study Note
profile
Study Log

0개의 댓글

관련 채용 정보