태블로 차원값과 측정값

생각하는 마리오네트·2022년 3월 2일
0

Visualization

목록 보기
19/31

태블로를 사용하다보면 아래와 같이 파란색으로 데이터 타입이 나타나기도 하고, 초록색으로 데이터 타입이 나타나기도 합니다. 잘 보면 "측정값 이름" 이라는 컬럼 아래에 실선이 그려져 있고, 이 실선을 기준으로 위는 파란색, 아래는 초록색으로 데이터 타입에 색상이 들어 있습니다.

태블로는 손쉽게 드래그 앤 드랍으로 사용하다보니 이러한 부분을 놓치면 드래그 해서 옮겨도 원하는 결과를 얻기 힘들기 때문에 이러한 부분을 다 알고 넘어가는것이 좋을것 같아요...(뭔가 배웠는데 혼자 잘 못하는 사람으로서...오늘부터 이렇게 공부방향을 바꾸고 있습니다 ㅠㅠ)

파란색은 "차원값", 초록색은 "측정값" 이렇게 구분을 할 수 있습니다.

  • 차원은 정성적 값(예: 이름, 날짜, 지리적 데이터 등)을 포함합니다. 차원을 사용하여 데이터의 세부 정보를 분류하고 나누고 표시할 수 있습니다. 차원은 뷰의 세부 수준에 영향을 미칩니다.
  • 측정값은 측정할 수 있는 정량적 수치 값을 포함합니다. 측정값을 집계할 수 있습니다. 측정값을 뷰에 끌어 놓으면 Tableau가 (기본적으로) 해당 측정값에 집계를 적용합니다.
    (Ref. 태블로 공홈)

공식홈페이지에서 설명된 글을 인용하였습니다. 그 중에서 개인적으로 받아들이는데 중요한 포인트에 볼드표시로 했습니다. 다른분들은 다른 부분에서 이해하기 쉬운 방식으로 받아들이시면 될것같습니다.

그렇다면 이해를 돕기 위해 데이터를 각각 집어넣어보겠습니다.

먼저 아래 데이터가 어떻게 생겼는지 보여드리겠습니다.

류현진선수의 경기 정보를 담은 데이터셋입니다.
먼저 No 컬럼은 공을 던진 횟수를 순서대로 나타내는것이고 각각을 공을 던졌을때(컬럼 순서대로) 볼인가 혹은 스트라이크인가, 구속이 얼마나되고 어떤종류의 공을 던졌는가, 날짜, 구속, 던진 공의 종류 입니다.

그렇다면 단순 횟수인 No 를 통해 차원과 측정에 각각 넣어보겠습니다.

측정값으로서 행에 가져다 놓게 되면 정말 던진 횟수의 측정값 즉 집계값이 표현이 위와 같이 그려진다.
그렇다면 이것을 차원으로 바꾸면 어떻게 될까??

위에 보이는 것 처럼 각각의 공을 던진 횟수가 하나의 차원으로서 만들어진다. 즉, 차원을 사용하여 데이터의 세부정보를 분류하고, 나누고, 표시할 수 있는 형태가 되는것이다.

이번데이터의 경우 던진 횟수당 볼과 스트라이크의 비율 과 같이 이러한 시각화를 원하고 있기때문에 차원으로서 쓰는게 올바를 것이다.

이렇게 차원과 측정을 잘 구분해서 사용해야 한다.

profile
문제를해결하는도구로서의"데이터"

0개의 댓글

관련 채용 정보