[2023.12.20] Tableau for Business Analytics

하은·2023년 12월 20일
0

- 퀵테이블 계산

- 누계(각 값을 누적)

예) 각 월별 매출, 누적 매출 함께볼 것
-> '매출' 더블클릭, '주문일자' 열선반으로 놓을 때(연속형 월선택)
-> 행에 있는 '매출' ctrl 눌러서 복사 - 차트가 두개 됨
-> 두번째 합계(매출) - 우클릭 - '퀵테이블계산-누계', - 우클릭 - '이중축'

- 차이(계산기준을 지난, 다음, 첫번째 등으로 설정가능)

  • 예)
    -> '매출' 더블클릭 - '주문일자' 열선반에 놓기(연속형 분기)
    -> '차트-막대'로 변경
    -> 합계(매출) - 우클릭 - '퀵테이블계산-차이' = 이전분기와의 차이가 나타남
    -> 뷰 우측하단에 한개의 값이 null. 맨 앞값은 비교대상 없어서 그럼. 우클릭해서 안 보이게
    -> '합계(매출)' 드래그 - '마크-색상'
  • 예) 새로운 시트
    -> '주문일자' - 행선반에 드래그 - 드릴다운(월까지, 분기는 뺌)
    -> 좌측에서 '매출' 더블클릭
    -> 마크에 있는 '매출'우클릭 - '퀵테이블계산 - 차이' = 바로 이전 값과 비교해서 차이를 구함
  • 예) 1월과 비교한 각 연도별 차이
    ** 세모모양표시=델타=테이블로 계산이 됐다는 뜻
    -> 마크에 있는 '매출' 우클릭 - '기준-첫번째'
  • 예) 각 연도별 1월과 차이를 구하기
    -> 마크에 있는 '매출' 우클릭 - '다음을 사용해 계산 - 패널 아래로'

- 구성

  • 예) 매출합계를 기준으로 각각의 제품 중분류별 매출의 구성배율 구할 것
    -> 좌측의 '제품 대분류, 중분류, 매출' 더블클릭
    -> 마크에 있는 '매출' 우클릭 - '퀵테이블계산-구성비율'
    = 전체 드래그하면 1또는 100%
  • 예) 대분류에 속한 제품 중분류에 비중을 만들어줄 것. '가구, 사무기기, 사무용품' 각각의 비중을 100%로 할당해서, 다 합치면 3또는 300%이 나오게 만들것
    -> 마크 '매출' 우클릭 - '테이블계산편집-특정차원-제품대분류 해제'
    ** '테이블계산편집'은 계산방식이 어떻게 되는지 하이라이트로 표시해줘서 직관적 / 차원을 여러개 넣고 행렬을 바꾸면 계산이 틀어져서 '테이블계산편집'에서 차원값을 직접 선택해주는 편
    = 노란색영역이 대분류 '가구'에만 해당. 가구에 해당하는 값만 드래그해보면 전체 합이 100%인걸 볼 수 있음
    -> '분석패널 - 총계 - 소계' = 각각 대분류별 총계 퍼센트가 100%로 나옴

- 순위

  • 예)
    -> '제품 대분류, 중분류, 매출' 더블클릭
    -> '마크-합계(매출)' - 세모 - '퀵테이블-순위'
  • 계산방식 변경: 순위매길때 같은 제품대분류 안에 있는 중분류 별 순위
    -> '마크-합계(매출)' - 세모 - '테이블계산편집 - 특정차원 - 제품대분류 해제'
  • 전체 기준 순위를 옆에 추가
    -> '측정값 - 매출' 더블클릭 - 우클릭 - '퀵테이블-순위'
    -> '합계(매출)' 우클릭 - 서식 - '숫자(표준)'
  • 측정값 이름 변경
    -> '마크-합계(매출)(1)' - 드래그 - 좌측사이드바로 - 이름지정'전체순위'
    -> '마크-합계(매출)(2)' - 드래그 - 좌측사이드바로 - 이름지정'제품대분류 내 순위'
    -> 좌측 '매출' - 중간의 '측정값'에 넣고 - '매출'에 대한 부분을 내림차순 정렬
    -> '제품대분류 내 순위'를 필터에 넣고 - '1, 3까지만 잡아주고' 확인
    = 같은 중분류 상위 3개 품목에 대해 순위, 전체순위, 매출 확인 가능
    = 월간리포트 상위10위 베스트셀러 항목 표현가능

- 비율차이, 전년대비 성장률

  • 비율차이 = 측정값들 사이의 퍼센트 차이 혹은 성장률

  • 전년대비성장률 = 같은 월에서 이전년도와 비교한 것

  • 예) 앞에있는 값과 비교해 증감을 퍼센트로 나타냄
    -> 좌측 '주문일자' 더블클릭 - 행선반으로 옮기기 - 드릴다운 '월까지, 분기는 뺌'
    -> 좌측 '매출' 더블클릭
    -> '마크-매출' - '퀵테이블계산-비율차이'

  • 전년 동월대비 성장률
    -> '매출' 더블클릭 - '퀵테이블-전년대비성장률'
    -> '측정값' 이름 변경 - ctrl 누르고 좌측바로 드래그 - '전년대비성장률' & '전월대비성장률'
    ** 실무에서는 전년대비성장률(날짜타입이 화면에 있어야 비교가능)보다 비중차이(비교대상만 있으면 됨, 전월과의 대비도 가능해서 자주 씀)를 주로 씀
    -> '2016년 1월 ctrl 6월' - '이 항목만 표시' - 전년대비성장률은 연도를 바라보기 때문에 계산값이 안 나옴, 화면상 비율차이는 6월의 직전월이 1월이니까 그에 대한 값 표시 가능

- 백분위

  • 예) 새로운 시트
    -> 좌측 '고객명, 매출' 더블클릭
    -> 뷰화면 '고객명 - 아래방향세모 - 필드 - 합계(매출)' = 내림차순정렬
    -> '마크-매출' - 우클릭 - '퀵테이블-백분위수'
  • 일반적으로 상위 n%로 표시하기 때문에 큰값을 0, 작은값은 100으로 변경
    -> '마크-매출' - 우클릭 - '테이블계산편집 - 백분위수, 내림차순'

- 이동평균

  • 평균 구하는 기간을 설정, 그 기간을 수로 나눠줌.
    = 시험성적 평균 구하는 것과 동일
    = 실제 주식데이터에서 많이 씀(5, 20, 60, 120일을 이동평균기간으로)
  • 예)
    -> 좌측 '매출' 더블클릭
    -> '주문일자' 드래그 - 열선반 - 연속형 분기
    -> 행선반 '매출' 우클릭 - '퀵테이블 - 이동평균'
    = 연분기 기준 매출에 대한 이동평균 적용 중
    -> 좌측 '매출' 드래그 - 뷰화면 축 안에 넣기 - 오른쪽 상단 색상범위 - 이동평균선은 주황색으로
    -> 상단 툴바 - '마크레이블표시'
    = 이동평균 계산방식: 2019년 4분기의 3억4천~은 = 2019년 2분기 3분기 4분기에 대한 평균
  • 평균 구하는 기간 변경
    -> '측정값-합계(매출)(2)' - 우클릭 - '테이블계산편집-이전값:5'
    = 2019년 4분기는 기존의 3억 4천에서~ 3억만 남음. 2018년 3,4, 2019년 1,2,3,4까지 총 6개의 값에 대한 매출평균
    = 이동평균선 = 성과기준

- YTD(year to day)총계

= 해당연도 시작일부터 현재일까지. 특정시점까지의 총계

  • 예)
    -> 좌측 '주문일자' 드래그 - 행선반 - 드릴다운(월까지, 분기는 뺌)
    -> '매출' 더블클릭 = 연월기준 매출값이 나옴
    -> '마크-매출' - 우클릭 - '퀵테이블-YTD총계'= 연도내 월별매출이 누적표시
    -> '측정값-매출' 더블클릭 - YTD에 잘 들어갔는지 확인
    = 누계와 거의 동일.
    = 누계: 시간의 흐름에 따라 연속적인 누계합계로 표시
    = YTD총계: 연도를 기준으로 연속적인 누계합계 표시

  • 누계, YTD총계 비교
    -> 계산되지않은 '마크-합계(매출)' - '퀵테이블-누계;
    -> 년바뀌면 새로, 계속 쌓여서 계산
    = YTD총계: 누계의 테이블계산을 기준으로 계산방식만 다름.
    = '누계 - 우클릭 - '다음을~' - 패널(아래로)'

- 통합성장률; 연평균 성장률(Compound Annual Growth Rate)

= 여러 해 동안의 성장률을 평균으로 환산한 것으로, 매년의 성장률을 산술평균(일반적으로 아는 평균)이 아닌 기하평균(복리효과 발휘한 평균)으로 환산한다.
= (최종연도값/최초연도값)^(1/연도간격)-1

-> 왜곡이 생김.
-> 산업이나 기업의 장기적성장을 위해서는 '기하평균'으로 연평균 성장률을 구해줘야 현실적인 값이 나옴

  • 예) 4년간 연평균성장률
    -> 좌측 '주문일자, 매출' 더블클릭
    -> '마크-합계(매출)' 우클릭 - '퀵테이블-통합성장률' = 기하평균 사용한 성장률
    = 2019년도 23.7%만 확인하면 됨
    -> '마크-합계(매출)' ctrl 드래그 - 사이드바'연평균성장률'
    -> 사이드바 '매출' 더블클릭 - '퀵테이블계산-전년대비성장률'
    -> 좌측 아래세모 - '계산된필드만들기' - 이름: 산술평균 - 'WINDOW AVG'(특정필드값 기준 평균값 반환) - 그 뒤에 '중간부분 측정값카드-전년대비성장률' 드래그 해서 괄호안에 넣음'
    -> 방금만든 계산된필드를 드래그해서 '측정값-연평균성장률'아래에 넣음 - 서식 - 백분율
    = 2019년 기준 연평균성장률과 산술평균값이 다르다는 걸 알 수 있음

- 계산된 필드

- 구성요소 = 모두 새로운 필드를 만들어줌

  • 필드: 데이터 원본에 존재하는 차원이나 측정값을 활용해 새로운 필드를 만듬
  • 연산자: 함수, 필드, 매개변수등을 사칙계산으로 새로운 값을 만듬.
    데이터 원본에 있는 차원이나 측정값 사용하지 않고도 상수값을 직접입력해 새로운 값을 만들 수 있음
  • 매개변수: 상수값을 동적인 값으로 변경
    최근 한달이나 1년등 필요에 따라 범위를 바꿔볼 때 사용
  • 함수: 데이터 원본의 필드와 태블로 내장함수를 활용해 데이터형태를 바꾸거나 원하는 값을 가져오는데 사용

- 연산자

  • 예)
    -> 좌측 '매출' - 드래그 - '마크-텍스트'
    -> '수량, 수익' 더블클릭
    = 하나의 측정값 안에 매출, 수량, 수익이 같이 표시됨
    ** 일반적으로 '주문건수'는 데이터원본에 없는 경우가 많아 별도로 만들어줘야함. 주의할 건, 중앙번호를 단순카운트하면 중복됨. 고유카운트; DISTINCT를 해줘야함. 고객이 여러제품을 한번에 구매했을 경우, 하나의 주문건수에 다수의 제품이 있기 때문에 같은 주문번호로 제품수만큼의 ROW가 DB테이블에 생성됨
    -> '주문번호' - 우클릭 - '만들기-계산된필드' - '주문건수' - COUNTD([주문번호])

  • 한번 주문할 때 발생하는 평균금액 확인위해, 주문건당 단가 추가
    -> 왼쪽 상단 아래세모 - '계산된 필드 만들기' -> '주문건당 단가' - '측정값필드- 합계(매출)' 드래그해서 넣고 / '주문건수(이미 COUNTD로 집계된 함수)' 넣어줌

  • 하나의 주문건에 평균적으로 발생하는 구매수량이 얼마인지 확인할 수 있는 필드 추가
    -> 왼쪽상단 - '계산된필드만들기' - '주문건당 수량' - '측정값-합계' 드래그 해서 넣고 / '주문건수' 드래그 해서 넣음

  • 수익을 보면 금액보다 수익률로 보는 게 직관적일 듯
    -> '계산된필드만들기' - '수익률' - '측정값-합계(수익)' 드래그 / '매출'

  • 주요 KPI는 다 만들었으니 뷰화면에 넣어줄 것
    -> 만든 '주문건수, 주문건당 수량, 단가, 수익률' 드래그 해서 '측정값'에 넣어줌
    -> 순서: 매출, 수량 = 합계(데이터원본에 있는 필드이기 때문에 기본방식인 합계로 계산됨)
    주문건수, 주문건당 단가, 수익, 수익률 = 집계(집계방식이 계산식에 포함돼있어서 집계로)

  • 측정값 서식 변경
    = 수익률이 0으로 나와있음. 현재 매출과 수익은 정수형태. 수익률에 대한 결과값이 소수점으로 나와서 정수형태인 0으로 나오는 중
    -> 측정값에 있는 '수익률' 우클릭 - '서식- 숫자형식 - 백분율 - 소수점 2자리'
    -> '주문건당 수량' - '서식- 숫자형식 - 숫자(사용자지정) - 소수점 1자리'
    -> 좌측 '주문일자' - 열선반에 넣기 = 작년과 비교해 연간 KPI지표 확인 가능

= 비즈니스를 볼 때 KPI설정해서 보는 게 매우 중요.
= 매출이 성장한다고 무조건 좋은 게 아님.
예) 2018년도와 2019년도 매출을 보면 성장했지만, 주문건당 단가/수량/수익률 지표는 오히려 떨어짐 = 개선점 파악가능

- 논리함수

  • if, case와 같은 함수를 말함.
    특정 조건이 참인지 거짓인지 여부 결정가능
    태블로에서 가장 많이 쓰는 함수 중 하나
    로직 세우는 게 어려운 함수라서, 다양한 상황에서 사용해보는 게 중요

  • 예)
    -> '매출' 드래그 - 열선반
    -> '제품중분류' 더블클릭 - 내림차순 정렬 - 전체보기
    -> '매출' 드래그 - '마크-레이블'

  • 식을 만들어서 매출합계가 2억 이상/미만인 제품 중분류를 색상으로 구분
    -> 상단 아래방향세모 - '계산된필드' - '매출 2억 구분' - IF SUM(['매출'] >= 200000000 THEN '2억 이상 매출' ELSE '2억 미만 매출' END
    -> '매출 2억 구분' 필드 드래그 - '마크-색상' - 오른쪽 색상편집 - '이상은 노란색, 미만은 회색으로 설정'

  • 2억기준 참조선 추가
    -> 좌측 '분석 - 상수라인 - 테이블' = 입력값=최소값을 기준으로 나옴
    -> 선 선택 - '편집 - 값:200M'

  • IIF함수를 써서 같은 결과값 만들 것
    -> '매출 2억구분' - 우클릭 - '편집 - 계산식 앞에 //를 넣어서 주석처리' - 추가: IIF((SUM(['매출'])>= 200000000, '2억 이상 매출', '2억 미만 매출')
    = 사용하고자 하는 조건이 한 가지면 IF보다는 IIF를 통해 문장길이 줄이는 걸 추천

  • IIF보다 더 간결하게 만들어보겠다
    -> 좌측상단 '계산된필드' - '매출 2억 구분_TF' - SUM(['매출']) >= 200000000
    -> 좌측보면 TF라고 표시돼있음.
    = 앞서만든 IF나 IIF는 조건 뒤 원하는 문자형태의 값을 입력해줌
    = TF 필드는 만든 로직이 참이냐 거짓이냐에 따라 결과가 나옴
    -> 만든 TF를 '마크-합계(매출)'위에 올려놓음
    = 색상범례가 T/F로 구분됨
    = 문자형보다 BOOL이 데이터 처리속도가 빠름

- 매개변수(범위형)

지난 시간 만든 2억구분 차트 활용

  • 예)
    -> 상수라인 제거, '색상-매출(2억)' 삭제
    -> 상단 - '매개변수만들기 - '이름: 특정 금액 이상, 데이터유형: 정수, 허용가능값: 범위, 최소값: 50M, 최대값: 500M, 단계크기: 최소값복사해서 동일하게'
    -> 매개변수 - 우클릭 - '매개변수 표시'
    = 단독으로 사용할 수 없고, 계산식이나 참조식과 함께 사용해야함

  • 계산식 생성
    -> 상단 - '계산된필드 만들기' - '이름: 특정 금액 이상 색상구분' - SUM(['매출']) >= 특정금액이상 매개변수 드래그
    -> '특정금액이상 색상구분'이 BOOL형태라 앞에 TF가 뜸. - '마크-색상'에 드래그 - '색상편집: 노랑, 거짓'
    -> 매개변수 조절하면서 값이 달라짐

  • 라인추가
    -> '분석 - 참조선 - 테이블 - 값: 특정금액이상, 레이블: 사용자지정 <값>, 라인: 점선 빨간색,
    = 값 변화에 따라 색상, 참조선, 참조선 값이 같이 바뀜

- 매개변수(목록형)

= 실무에서 대시보드 제작시 많이 사용
= 외국계회사인 경우 화폐단위가 달라서 필수적으로 사용해야함

  • 예) 원화와 달러기준의 매출 같이 확인할 수 있는 테이블
    -> 새로운 시트 - '주문일자, 제품 대분류, 매출' 더블클릭
    -> 상단 - '계산된필드만들기' - USD - SUM(['매출']) / 1120
    -> USD를 뷰화면의 매출값이 표시된 영역에 드래그
  • 다른 사람과 같이 볼 경우를 생각해 좀 더 쉽게 화면 구성
    -> 상단 - '매개변수 만들기 - 이름: 환율, 허용가능한 값: 목록, 값: 1 - 1120, 표시형식: KRW - USD
    -> 매개변수 우클릭 - '매개변수표시'
  • 매개변수는 단독으로 사용이 안 돼서 계산된 필드 추가해서 매출과 같이 묶어줄 것
    -> '계산된필드 만들기' - KRW/USD - SUM(['매출']) / 환율 매개변수 드래그해서 가져오기
    -> KRW/USD 필드를 '측정값' 마지막 아래쪽에 추가
    = 합계 매출액 값과 동일하게 표시됨
    = 현재는 매개변수가 KRW로 설정돼있음
    = 우측에서 바꿔주면 USD로 바뀜

- 매개변수(날짜형)

= 실무에서 대시보드 제작시 많이 사용
= 실무자용 대시보드 만들 때 날짜형태는 from 형태의 매개변수 추가해서 만듬
월이나 분기단위로도 보지만, 특정 이벤트를 진행했을 때 그 기간의 성과를 보기에 유용하기도 함.

  • 예)
    -> 새 시트 - '주문일자' 드래그 - 열선반(주문일자 연속형)
    -> '매출' 드래그 - 행선반
    - 범위지정
    -> 아래세모 - '매개변수만들기' - From - 데이터유형: 날짜
    -> '매개변수만들기' - To - 데이터유형: 날짜
    -> 둘다 우클릭 - '매개변수표시'
    -> from = 2019.01.01, to = 2019.01.31
  • 계산된 필드와 매개변수를 묶어서 동적으로 만들어주기
    -> 아래세모 - '계산된필드만들기' - 날짜선택 - 주문일자 드래그 >= [From]
    AND
    주문일자 드래그 <= [To]
    -> '날짜선택' 필드 - 필터로 이동 - '참'만 표시
    -> 행선반 '주문일자' 우클릭 - 불연속형

- 매개변수(복합 매개변수)

= 한 화면에서 다양한 각도로 분석이 필요할 때 복합 매개변수 활용

  • 예) 하나의 차원이나 측정값이 아니라, 여러개를 바꿔가면서 보려는 것.
    = 차원과 측정값을 각각 매개변수와 엮어서 하나의 필드로 만들 필요가 있다
    = 차원은 제품 중분류와 대분류를 바꾸고, 측정값은 매출 수량 수익 할인율을 바꿔서 볼 것
    -> 새 시트 - 아래세모 - '매개변수만들기' - 차원 선택 - 허옹가능값: 목록, 값: 1, 2 / 표시형식: 제품 대분류, 제품 중분류
    -> '매개변수만들기' - 측정값 선택 - 허용가능값: 목록, 값: 1, 2, 3, 4 / 표시형식: 매출, 수량, 수입, 할인율
    -> '매개변수' 우클릭 - 화면에 '매개변수표시'
  • 계산된 필드로 매개변수 엮기
    -> '계산된필드만들기' - 차원 필드 선택 -
    CASE 차원선택드래그
    WHEN 1 THEN [제품 대분류]
    WHEN 2 THEN [제품 중분류]
    END
    -> '차원필드선택' 드래그 - 열선반
    -> 아래세모 - '계산된필드만들기' - 측정값 필드 선택 -
    CASE 측정값선택 매개변수 드래그
    WHEN 1 THEN SUM([매출])
    WHEN 2 THEN SUM([수량])
    WHEN 3 THEN SUM([수익])
    WHEN 4 THEN AVG([할인율]) * 100
    END
    -> '측정값필드선택' 드래그 - 행선반, '마크-레이블'
  • 측정값별 단위를 붙여주기
    -> 좌측 '측정값필드선택' 우클릭 - '복제'
    -> 우클릭 - '편집' - 단위선택 -
    WHEN 1 THEN '원'
    WHEN 2 THEN '개'
    WHEN 3 THEN '원'
    WHEN 4 THEN '%'
    END
    -> '단위선택' 필드를 '마크-레이블'에 넣어주기
    -> '레이블' 선택 - '텍스트-편집' - 단위를 측정값 옆으로 붙여줌
  • 매개변수에 따라 시트 명이 바뀌도록
    -> 뷰화면 상단 '시트명' 우클릭 - '제목편집' - 현재 이름 지우고, 삽입 - <매개변수차원선택> <매개변수 측정값선택> - 차원선택은 파란색, 측정값선택은 빨간색으로 수정

0개의 댓글