Tableau
See and Understand Data
장점
- No code -> Speed good!
- 상호작용 Good
- Communitys
3-1. Tableau Public,MakeoverMonday,TableauTipTuesday...etc
다양한 커뮤니티들이 운영 중이기에 여러 정보를 습득 할 수 있다.
서버데이터 연결하는경우
- 실시간 대시보드를 사용할 떄
- 업데이트와 스키마 변경이 빈번할때
- 보안이 중요한 데이터 일 경우(권한이 필요할때)
서버의 종류
- Mysql
- Google Bigquery,spreadsheet
- Salefore
- Amazon Redshif
이외에도 무수히 많은 서버를 지원
URL 주소 불러오는 방법
=importhtml("https://www.worldometers.info/coronavirus/","talbe",1)
- 해당 주소에서 테이블 형식으로 첫번재 테이블을 가져온다
- 구글시트에 함수로 입력하면 지속적으로 갱신가능(지금은 막힌것으로 보임)
데이터 관계는 데이터 분석을 위해 여러 테이블에서 데이터를 결합하는 방법
- 조인과 달리 단일 테이블로 병합되지 않고 각 테이블을 유지하기 때문에 집계값이 중복되지 않는다.
연결
- 데이터베이스에 쿼리 보내고 결과에 따라 뷰 업데이트
- 성능을 향상시키기 위해 데이터를 로컬에 저장
데이터 원본창
그룹만들기: 서로 다른 차원 멤버들을 그룹지어준다
분할: 태블로가 알아서 적절하게 분할해 여러개 열로 나누어준다
피벗: 가로늘어진것을 세로로 바꾸어준다.
Pratice_Visualize
Scatter plot
Lineplot
- 년 정보는 열에 넣어주는것이 좋다.
- ctrl cmd를 누르고 필드를 복사 가능하고
- 레이블을 선택할 경우 차트에 반영 가능하다.
Bar chart
Map Chart
Dashboard
앞서 연습해본 차트들을 하나의 DashBoard에서 표현이 가능하다...!
차원 & 측정값
차원과 측정값이 함꼐할떄 인사이트 발생
- 측정값은 그 자체 만으로 인사이트 x
- 차원으로 쪼개지면 의미를 갖게 된다
차원 : 나눠서 볼 기준( 지역,연도,성별)
- 숫자를 자르는 기준 (범주형데이터)
- 측정: 값 그자체(매출 수익 배송비 등)
- 숫자(수치형 데이터)
ex) 측정값만 넣어두면 마크가 1개만 찍힌다
ex) 여기에 차원값을 추가하면 마크가 쪼개지면서 마크의 수가 증가하게된다.
연속 데이터
- 연속은 초록 / 오름.내림 정렬x / 트렌드 확인 가능 / Header
불연속 데이터
- 불연속은 파란색 / 오름.내림 정렬o / 카테고리별 /Axis
집계방식
row level vs agg level
we have to ues agg level
워크시트
마크카드
색상
Cognitive load (인지부하)
여러 색상을 사용하면 보는 사람이 인지하기 힘들다.
VLOD (세부정보)
서식
격자선, 영 기준선, 축 눈금자 -> 없음으로 설정하면 깔끔하게 확인
차트
100% 누적차트
feature가 너무 많을때 직관적으로 볼 수 있음
슬로프차트
전년도 대비
이중차트
스파크 라인
- 트렌드 추세선 확인 가능
- 머리글 표시 해제
- 축편집 - 0 포함 해제
캘린더 차트
간트 차트
날짜를 나타내는 차트