Dimension과 Measure의 뜻과 차이
태블로(Tableau)와 같은 데이터 시각화 도구에서 Dimension(차원)과 Measure(측정값)는 데이터를 분석하고 시각화할 때 핵심적으로 사용되는 두 가지 데이터 유형입니다.
Dimension (차원)
의미
- 데이터를 그룹화하고 분류하는 데 사용되는 필드
- 주로 텍스트 또는 범주형 데이터를 포함
- 데이터의 "질적" 특성을 나타내며, 데이터를 구분하는 기준이 됩니다.
예시
- 고객 이름, 제품 카테고리, 지역, 날짜 등이 Dimension의 대표적인 예입니다.
- 예: "고객별 판매액"에서 고객 이름은 Dimension입니다.
특징
1. 범주형 데이터
- 값이 정해져 있고 반복되는 데이터(예: "A 지역", "B 지역").
- 축 역할
- 시각화에서 Dimension은 데이터의 축(X축, Y축) 또는 필터로 자주 사용됩니다.
- 그룹화 가능
- 데이터를 세분화하거나 묶어 결과를 분석할 수 있습니다.
Measure (측정값)
의미
- 숫자로 측정할 수 있는 데이터를 포함하며, 수학적 계산이 가능한 필드.
- 데이터의 "양적" 특성을 나타냅니다.
예시
- 판매액(Sales), 이익(Profit), 수량(Quantity), 평균 매출 등이 Measure에 속합니다.
- 예: "고객별 판매액"에서 판매액은 Measure입니다.
특징
- 연속형 데이터
- 값이 연속적으로 증가하거나 감소하는 데이터(예: 100, 200, 300).
- 집계 가능
- Measure는 합계(SUM), 평균(AVG), 최소값(MIN), 최대값(MAX) 등으로 집계됩니다.
- 계산 가능
- Measure는 계산된 필드 또는 LOD 표현식에서 사용됩니다.
Dimension과 Measure의 차이점
| 특성 | Dimension (차원) | Measure (측정값) |
|---|
| 데이터 유형 | 텍스트, 날짜, 범주형 데이터 | 숫자형 데이터 |
| 주요 기능 | 데이터를 분류하고 그룹화 | 데이터를 계산하고 집계 |
| 시각화 역할 | 축(X, Y), 색상, 필터로 사용 | 바, 선, 크기 등으로 값 시각화 |
| 집계 여부 | 집계되지 않음 | 집계 가능 (SUM, AVG, COUNT 등) |
| 예시 | 지역, 제품 카테고리, 고객 이름 | 판매액, 수익, 수량 |
Dimension과 Measure의 상호작용
Dimension과 Measure는 함께 사용되어 강력한 분석을 가능하게 합니다. 예를 들어:
- Dimension을 기준으로 데이터를 구분: "카테고리별" 또는 "지역별".
- Measure를 통해 숫자 데이터의 크기나 변화를 분석: "총 판매액" 또는 "평균 이익"
예시
"지역별 총 판매액"을 분석한다면:
- Dimension: 지역(Region)
- Measure: 판매액(Sales)
Dimension과 Measure 변환
태블로에서 Dimension과 Measure는 필요에 따라 서로 변환 가능합니다.
- Measure를 Dimension으로 변환: 숫자 필드를 범주형 데이터로 사용하고 싶을 때
- Dimension을 Measure로 변환: 특정 카테고리를 숫자로 집계하고 싶을 때
이해를 돕는 비유
Dimension: 데이터를 분류하는 책장의 "칸" (예: 지역별 책장).
Measure: 각 칸에 쌓인 "책의 두께" (예: 해당 지역의 판매 총액).