DATA LITERACY - 데이터를 보고 활용할 수 있느 능력. 탐색을 통해 이해하고, 통찰하는 능력. 구성원들이 데이터에 쉽게 접근할 수 있도록
*JOIN
설명: 로지컬 테이블에서 새로운 테이블을 끌어다 놓으면 관계가 형성됨.
더블 클릭해서 피지컬 테이블 화면에 끌어와서 JOIN해줘야 함.
다이어그램이 형성됨. 조인 유형 변경 가능.
같은 피드명이 존재하면 KEY값을 잡아줌
확인: 데이터 그리드에서 확인가능하고, 추가된 필드는 맨 오른 쪽에서 확인가능
로지컬 테이블: 각 시트 및 테이블간의 관계만 설정. 공동된 필드로 관련방식설명. 테이블을 하나로 병합하지는 않음. 테이블은 각 분리되며 고유한 상태를 유지함. 관계형성은 두 테이블 간의 약속. 약속에 따라 데이터를 가져온 후 적절한 JOIN쿼리를 작성.
결론: JOIN과 관계는 큰 차이가 있다. 데이터를 물리적으로 병합해서 하나의 테이블로 만든ㄴ 것/ 물리적으로 결합하지는 않음.
편집
1) 데이터 필드명 변경
F1, F2 혹은 직관적이지 않은 경우, 누구나 이해가능하게 변경
메타 데이터 목록을 통해 원격필드에서는 원본이 어떻게 있었는지 추적해볼 수 있음
2) 데이터 타입 변경
날짜 타입 -> 문자 타입 등 변경가능.
3) 필터
데이터원본에 필터를 적용해 분석에 필요하지 않은 범위에 대해 축소하면, 속도 향상시킬 수 있음. = 전처리
*오른쪽 상단 필터 - 추가 - 추가 - 필터하고자하는 필드 선택 - 항목선택 - 확인 - 확인
: 날짜 : 이벤트 성과 등 확인 시
: 매출 등 측정값 = SALES
인터페이스
1) 우측 하단 '새로운 시트 만들기'
2) 좌측 데이터 목록= 필드
상단영역: 차원 / 하단영역: 측정값
더블클릭하면, 추천하는 그래프 형식으로 뜸.
3) 시각화
마크 영역을 사용 혹은 우측 '표현방식'
4) 하단 시트 영역
생성, 원본으로 돌아감 등이 가능
데이터를 끌어다놓으면 성격에 따라 차원/측정값으로 자동분류됨
드래그해서 속성변경 가능.
= 집계된 측정값을 원하는 차원레벨에 맞춰 잘라서 볼 수 있음.
차원
= 정상적인 값. 이름, 날짜, 지리적 데이터 포함.
= 데이터의 세부정보 나눠 분류가능
측정값
= 집계가 가능하거나 필요할 수 있는 데이터
= 숫자로 구성
더블클릭 또는, 드래그 해서 상단에 놓을 때
= 차트 생성
뷰 영역으로 드래그 했을 때
= 집계된 결과값 생성. 마크카드 옵션에서 텍스트를 가지게 됨.
예)
-세일즈 측정값: 뷰 영역 - 드래그
-카테고리 차원필드: 더블클릭
-->세일즈 데이터가 카테고리 항목만큼 분할돼서 표시
-오더데이트 차원값: 카테고리 옆에 드래그
--> 연도별 각 카테고리의 매출값이 집계
-필드 앞 +버튼 누르면 하위단계로 내려가서 드릴다운 분석이 가능
예) 차원과 측정값이 자동배치된 걸 변경
측정값을 차원으로 옮기고 더블클릭
-속성변경=고객분석에 많이 사용: 마스터 테이블에는 고객ID등의 고유값만 있어서 차원형태로 인식. 고객수 카운트위해서는 속성변경해야함.
연속형(초록색) / 타이틀이 축으로 생성
불연속형(파란색) / 머릿글로 생성
예)
SALES와 카테고리를 더블클릭해서 차트 생성
:파란색 필드(카테고리)에서 우클릭- 서식 - 사이드바가 [머리글] 변경할 수 있게 뜸.
:초록색 필드(SALES) 좌측 숫자 선택 - 우클릭 - [축]이 표시 됨
예) 날짜타입 = 불연속형으로 구분되지만, 목적에 따라 연속형으로 변경가능
: SALES 더블클릭, ORDER DATE 더블클릭 - ORDER DATE를 CTRL누른채로 드래그 해서 필터 부분에 놓음 - '년'선택 - '2020'년만 선택 - 점 하나만 보일텐데, +를 눌러서 드릴다운
-> 불연속으로 뜸
: 시트 복사본 생성 - 드릴드롭해서 처음으로 돌아옴 - ORDER DATE 우클릭 - '일'형태의 연속형으로 변경
-> 연속으로 뜸
예) 색상구분
: 매출, SUB CATEGORY 추가 - 행과 열을 바꿔주고, 내림차순 정렬(상단 아이콘 버튼) - SUB CATEGORY를 CTRL 누르고 '마크'부분의 색상에 놓기 - 각 다른 색상으로 표현됨
: 연속형 필드(매출)를 색상에 넣음 - 불연속형 필드와 다르게 같은 색상의 그라데이션으로 표현.
= 색상도 표현방식에 따라 연속형, 불연속형으로 변경가능
텍스트 테이블, 하이라이트 테이블
: 시각화는 아니지만, 카드지표나 정확한 값이 표현돼야할 때
: 엑셀에 익숙해진 다른 부서와 대시보드를 공유해서 사용할 때. 단순한 시각화가 훨씬 상대방이 이해하기 좋음.
테이블 생성
'고객 세그먼트', '매출'을 넣고 '행렬' 바꿔줌
-CTRL 누르며 '매출'을 '마크 - 색상'에 끌어다 놓음
-'마크-사각형'으로 바꿔줌. 값이 높은 순으로 색상이 진하게 표현됨
('제품 중분류'같이 값 많은 걸 넣어주면 시각화 효과가 두드러짐)
막대 테이블
: 특정 집계에 대한 절대적인 크기를 시각적으로 표현하기에 적합
: 엑셀이나 PPT에서 많이 사용해 일반적으로 사람들에게 익숙한 차트
: 단순한 '크기'를 보여주고자 한다면, 막대그래프 활용이 적절
테이블 생성
'고객 세그먼트', '매출'을 넣음
*순서에 따라 차트형식이 달라짐
1) '차원' - '측정값' -> 표 생성
2) '매출'(측정값) -'고객 세그먼트' (차원)
= 자동으로 막대차트 생성
-> 효과적인 시각화 위해 행렬전환 - 내림차순정렬 - 화면 전체보기
-> 세그먼트 구분을 위해, '고객 세그먼트' 를 '마크-색상'에 넣어줌
-> 차트 정리를 위해 '마크'에 '매출'을 끌어오고 우클릭 - 서식 - 패널 - 숫자 서식 중 단위를 '사용자 지정' - '디스플레이 패널' 중 '백만'으로 변경 - 맞춤은 가운데 맞춤으로 변경
= 차트나 대시보드를 마무리 하기 전에, 누구와 공유해서 사용할 것인지 생각하고 마무리 하는 게 중요