[Zero-Base]데이터 취업 스쿨 스터디 노트(Tableau Basic)

강현정·2024년 6월 14일

zero_base

목록 보기
38/54

Tableau Data 전처리

Union

  • sql과 마찬가지로 데이터시트를 통합하여 볼 수 있다.
  • 드래그해서 위에 놓으면 연결된다.
  • 각 테이블의 필드 수와 이름, 유형등이 일치해야 유니언이 잘 된다.

Join

  • 조인의 경우 테이블을 더블클릭해서 로지컬 스키마상에서 실행시켜야 한다.
  • 기본적으로 inner join으로 된다.
  • 가운데 교집합을 클릭하면 조인의 유형을 선택할 수 있다.

📌Logical table에서는 각 테이블 및 시트를 공통된 형태로 보여주지만 물리적으로 병합하지는 않는다. 반면 Physical table에서는 물리적으로 하나로 결합하는 형식이다.


데이터 변경

  • 필드명을 더블클릭해서 변경
  • 필드 유형 변경 가능
  • 필터를 적용해 불필요한 데이터 처리 가능(각 유형마다 범위선택 가능)
  • 제외항목을 통해 제외하고자 하는 데이터 선택 가능
  • 'Sales'와 같은 필드의 경우 값의 범위를 지정해서 필터링 할 수 있다.

Tableau 기본 컨셉 이해

인터페이스

  • tableau 에서는 아래 테이블 안의 요소들을 필드라고 하고, 상단 영역과 하단 영역으로 나뉜다.
  • 상단에 있는 필드들은 차원이라고 하고, 하단에 있는 필드들은 측정값이라고 한다.

  • 필드를 두번 클릭하게 되면 태블로가 추천하는 그래프로 시트에 작성해준다.
  • 시트간 또는 데이터 원본으로의 이동

차원 vs 속성값

  • 차원: 이름, 날짜 , 지리적 데이터 등 정성적 값을 포함한다. 차원을 사용하여 데이터의 세부 정보를 분류하고 나누고 표시할 수 있다. 차원은 뷰의 세부 수준에 영향을 미친다.
  • 측정값: 측정할 수 있는 정량적 수치값을 포함한다. 측정값을 뷰에 끌어놓으면 태블로가 기본적으로 해당 측정값에 집계를 적용한다.
  • (이 둘은 드래그를 통해 상호간 이동이 가능하다.)
  • 측정값을 더블클릭 할 경우 그래프 형태로 나오고, 드래그해서 시트로 넣을 경우 수치로 표현이 된다.

  • 차원의 경우 행을 여러개 놓아 피봇테이블처럼 시각화를 할 수 있으며, 날짜와 같은 경우 아래와 같이 세부적으로 계층을 나눌 수 있다.

  • 고객 아이디와 같은 경우는 자동으로 차원 값으로 분류되는데, 고객 고유의 아이디를 통해 카운트를 하고싶다면 측정값으로 이동해서 한 번에 사는 횟수별 고객의 카운트를 할 수 있다.


연속형 vs 불연속형

  • 태블로에서 연속형은 초록색, 불연속형은 파란색으로 나타나있다.
  • 측정값, 차원필드에서 다른 필드로 이동한다면 색이 바뀔 수 있다.
  • 이때 불연속형은 파란색이며 축을 나타내고, 연속형은 초록색이며 머리글을 마나탠다.
  • 아래와 같이 사용하고자 하는 목적에 맞게 필드를 연속형, 불연속형으로 바꿔줄 수 있어야한다.(첫번째 불연속형, 두번째 연속형)

0개의 댓글