1. 차원과 측정값

Tableau에서 데이터를 가져올 때, 자동적으로 데이터의 성격을 판단해주며 데이터의 유형에 따라 결정될 수 있다. 예를 들어, '고객 이름'과 같은 데이터 필드는 문자열 데이터이므로 Abc 아이콘으로 표시되고, '배송 날짜'는 날짜 데이터이므로 📆 아이콘으로 표시된다. 또한, '매출'과 '수량'과 같은 데이터는 수치형 데이터이므로 #(샾) 모양 아이콘으로 표시된다.

Tableau에서 판단하는 다른 데이터 속성은 차원(Dimension)측정값(Measure)이다.

회색선을 기준으로 위쪽에 있는 데이터 필드들이 차원이고 회색선 아래쪽에 있는 데이터 필드들이 측정값이다.

1.1 데이터 필드 역할 및 유형 정보

데이터 필드는 데이터 원본의 열에서 만들어집니다. 각 필드에는 정수, 문자열, 날짜 등과 같은 데이터 유형과 불연속형 차원이나 연속형 측정값(보다 일반적) 또는 연속형 차원이나 불연속형 측정값(덜 일반적) 같은 역할이 자동으로 할당된다. 역할은 차원이나 측정값을 지정하고, 유형은 데이터의 종류를 나타낸다.

  • 차원(Dimension): 차원은 데이터를 설명하는 범주형 정보로 정성적 값을 포함한다. 주로 데이터를 분류하거나 그룹화할 때 사용된다. 예를 들어, 지역, 제품 카테고리, 고객 세분화 등이 차원에 해당한다.

차원 필드 중 '고객 이름'을 더블 클릭하면 '고객 이름'이 아래 이미지와 같이 표의 형태로 표시된다.

  • 측정값(Measure): 측정값은 수치형 데이터이며, 연산 가능한 값을 가진다. 일반적으로 데이터를 계산하고 분석할 때 사용된다. 매출, 수량, 이익 등이 측정값에 해당한다.

측정값 필드 중 '매출'을 더블클릭하면 아래 이미지와 같이 막대 그래프로 표시된다.

차원을 먼저 추가하느냐 측정값을 먼저 추가하느냐에 따라 Tableau가 기본적으로 표시하는 표의 형태가 달라진다. 하지만 차원과 측정값, 그리고 마크카드를 적절히 활용하면 언제든지 원하는 방식으로 시각화할 수 있다.

예를 들어:
상품 카테고리별 매출 > 차원 : 상품 카테고리 + 측정값 : 매출

성별에 따른 평균 키 > 차원 : 성별 + 측정값: 키

직급별 성과급 > 차원: 직급 + 측정값 : 성과급

디저트 종류에 따른 칼로리 > 차원 : 디저트 종류 + 측정값 : 칼로리

'측정값 이름'은 측정값에 속하는 데이터 필드들의 이름을 나타내는 필드이다. 이는 Tableau에서 자동으로 생성되는 필드이다.

'측정값 이름'을 더블 클릭하여 뷰에 추가하면, 측정값에 속하는 필드들이 자동으로 표로 표시된다.

'측정값 이름'을 추가하면 각 측정값들이 대략적으로 어떤 값을 갖고 있는지와 어떤 형태의 값들인지 확인할 수 있다.

측정값 이름이 추가가 되면서 측정값 카드가 마크카드 아래 생긴것을 아래 이미지를 통해 확인할 수 있다.

측정값 카드를 확인하면 각 측정값이 어떤 방식으로 집계되었는지 볼 수 있다. 예를 들어, '매출'이라는 측정값은 합계로 집계된 것을 확인할 수 있다. 물론 해당 집계 방식은 태블로에서 자동으로 부여하는 것이며, ▼을 클릭하면 '측정값 (합계)' 메뉴에서 합계 외에도 다른 집계 방식을 선택할 수 있다.

차원을 측정값으로, 측정값을 차원으로 변환하는 것은 Tableau에서 유용한 기능 중 하나이다.

첫번째 방법으로는 데이터 필드 중 '세그먼트'와 같이 차원에 속하는 필드를 측정값으로 변환하는 것이다. 이를 위해 해당 데이터 필드를 선택한 후 ▼을 클릭하면 '측정값으로 변환'이라는 옵션이 나타난다. 이 옵션을 선택하면 해당 데이터 필드가 자동으로 측정값으로 변환된다.

두번째 방법은 데이터 필드를 드래그하여 차원 또는 측정값 영역에 놓는 것이다.

예를 들어, '고객 이름'을 더블 클릭하면 다음과 같이 표의 형식으로 나타난다.

여기서 '수량'을 더블 클릭하여 뷰에 추가하면 고객별 주문건을 나타내는 표가 생성된다.

하지만, 반대로 수량을 기준으로 고객 수를 세고 싶을 수도 있다. 이를 위해서는 '수량'을 측정값으로 사용해야 한다. 이렇게 하면 각 수량에 해당하는 고객 수를 셀 수 있다. 예를 들어, 한 주문에 한 개의 제품을 구매한 고객은 몇 명인지, 2개를 구매한 고객은 몇 명인지 등을 파악할 수 있다.

이러한 방식을 사용하면 쇼핑몰이나 이커머스와 같은 분야에서 한 주문당 고객이 구매한 제품 수를 파악하는 데 유용하다.

따라서, '고객 이름'과 '수량'을 변경해보자.

'고객 이름'을 측정값으로 변환하고, '수량'을 차원으로 변환한다. 그리고 '수량'을 더블클릭한다. 그러면 수량 기준의 표가 아래의 이미지와 같이 생성된다.

그런 다음 '고객 이름'을 측정값으로 추가하면 '고객 이름'이 카운트 되는 것을 확인할 수 있다. 즉 '고객 이름'은 카운트 고유라는 집계 방식이 부여되었다.

카운트 고유는 중복값이 발생하지 않도록 세는 것으로, SQL의 COUNT DISTINCT와 유사하다. 따라서 해당 표에서 한 개를 구매한 고객의 수는 562명이고, 2개를 구매한 고객은 748명으로 '수량'을 기준으로 고객이 카운트 되는 것을 확인할 수 있다.

이러한 방법을 통해 차원과 측정값을 원하는 방식으로 변경하여 원하는 형태의 표를 생성할 수 있다.

profile
거북선통통통통

0개의 댓글