데이터 불러오기 / 탐색 / 재구조화 - pd.melt(), pd.pivot_table() / 데이터 타입 변경 / 불필요한 데이터 제거 (행, 열) / 컬럼 양식(값) 변경 / csv 저장
os 라이브러리의 주요 메서드와 반복문을 활용하면 동일한 작업을 반복 처리 가능
Tableau 인터페이스 / 차원값과 측정값 / 연속형과 불연속형
하이라이트 테이블 / 바 그래프 / (100%) 누적 바 그래프 / 비중 표시 그래프 - 파이차트, 트리맵
라인 그래프 : 개별값들의 변화를 볼 수 있음 / 영역 그래프 : 시간에 따라 각 값이 차지하는 비중이 어떻게 변화하는지 확인할 때 유용 // 응용 - 라인 그래프 + 포인트 / 도넛 차트 / 변형 바 그래프
Dateparse('날짜 형식', '바꿀 문자열') // DATEPARSE 계산 만들기 1. 날짜 필드의 현재 형식 검토 2. 차원 패널의 날짜 필드를 우클릭하여 만들기 - 계산된 필드 선택 3. 대화 상자에서 DATEPARSE 함수 작성 // 로캘 고려
Tableau 대시보드 / 대시보드 사용성 높이는 방법 - 필터, 하이라이터
인터랙티브 대시보드 생성 - 필터 동작, 하이라이트 동작 추가
Tableau 관계 : 테이블 간 조인없이 설정 가능 / 조인시 발생 가능한 데이터 중복이나 필터링 문제 방지 가능 // 조인 = sql 조인
Looker Studio 장점 / 인터페이스 / vs Tableau // 측정기준(차원) / 측정항목(측정값)
표 / 피벗테이블 / 조건부 서식 / 필터 추가 // 파이차트 / 도넛차트 // 막대 그래프
참조선 추가 방법 / 매개변수 생성 및 추가 방법 / 매개변수의 유용한 점 // 참조밴드
Looker Studio 날짜 변환 PARSE_DATE('날짜 형식', '바꿀 문자열') = 태블로의 Dateparse 함수와 동일 (날짜 형식이 다름) // 시계열 차트
Looker Studio 대시보드 - 교차필터링 / 컨트롤 / 데이터 연결 방법
Big Query : 대표적인 데이터 웨어하우스 중 하나 / 데이터 웨어하우스? / Big Query 사용 준비
큰 지표에서 작은 지표로 / 분석가는 지표를 잘 사용하고 다룰 줄 알아야 함
빅쿼리에서 날짜 다루기 - DATE() / DATETIME() / TIMESTAMP() // EXTRACT : 날짜 일부 추출 // TRUNC : 원하는 부분까지만 남김 // 종합쿼리에 날짜 추가
EXCEPT / REPLACE // CAST / SAFE_CAST - SAFE_DIVIDE // ROW_NUMBER / RANK / DENSE_RANK / CASE
대시보드용 데이터 준비 >> 1. IN을 활용하여 특정 상태만 집계 ('shipped', 'delivered') / 2. 일자별 지표 / 3. +) Round 활용하여 소수 둘째 자리까지만 표시하고 SAFE 연산 사용 / 4. 컬럼명 영문으로 대체
요청 1. 주별 주문 수와 고객 수 / 요청 2. 상파울루(SP), 리우데자네이루(RJ)만 / 요청 3. 도시(city)별 주문 수와 고객 수, 매출 순위 / 요청 4. 월별 평균 소비 금액 / 요청 5. 도시(city)별 주문 수와 고객 수, 매출
누계 / 차이 / 비율차이(증감률) / 구성비율과 순위 / 이동평균 / YTD총계와 성장비율 / 전년대비성장률 / 통합성장률
Tableau Sales 대시보드 - 매개변수 생성 및 표시, 동작 추가
IF / IIF / T/F // 매개변수 // FIRST/LAST // FIXED
Looker Sales 대시보드 - 빅쿼리 데이터 연결 / 스코어카드 만들기 / 시계열 차트 / 표 / 영역(비중) 그래프 / 매개변수, 필드 설정 / 기간 컨트롤 // 기간매개변수 활용
고객 행동 지표 : Funnel 분석 // AARRR프레임워크 - Acquistion (유입) / Activation (활성화) / Retention (유지) / Referral (추천) / Revenue (수익)
활성유저 확인 (이동평균) / 행동별 활성 유저 / 행동 전환 유저 / 거래액 규모 / 브랜드&카테고리별 상세 / 페이지 전환 매개변수
데이터 분석 Flow / 시나리오 // Data Tool // 사용할 데이터셋
데이터 기본 정보 확인 / Groupby / Pivot_table / stack, unstack // Visualization - matplotlib, seaborn / 히트맵 / barplot / regplot / histplot / jointplot
자주 쓰는 단축키 / DB insert // column 읽기(SELECT) / DISTINCT & count / GROUP BY & ORDER BY / 비교연산자 / 논리연산자
테이블 생성 후 데이터 넣는 방법 2가지 / 테이블 관계 연결 // Data Type // Table Join // LIMIT & HAVING // Window Function / LEAD & LAG
데이터 가져오기 - csv / MySQL // 데이터 변환 - 열 추가 / 열 병합 및 분할 / 텍스트,숫자 데이터 다루기
PowerBI 그래프 - 캔버스 설정 // 드릴다운 / Table & Matrix / 조건부 서식 / 테이블 관계 생성 // Dax식 Calculate / 카드 / 슬라이서 / 축소다중항목 / Top N 필터
사용할 데이터셋 및 컬럼 정의 확인 // 재고관리 주요 지표 // 데이터 탐색
재고 수량 파악 / 악성 재고 원인 파악 (가격, 신상품 출시, Aging (얼마나 오랫동안 재고로 있었는지) // Appendix. CASE WHEN / From절 SubQuery vs WITH절
SKU Type별로 Segment를 나누고 각 Type별 특성에 맞는 관리 방안 수립 / SKU Grade 분류 기준 // SKU Grade 테이블 생성 (과정) 쿼리
데이터 전처리 // 지표 정의 및 생성 // 차트 생성 / 인터랙티브 차트 - switch & selectedvalue // SKU Grade 테이블과 관계 설정 // 페이지 이동 단추
SCM 정의 // 사용할 데이터 셋 // 목표 // 유통 workflow 및 이해관계자
데이터 가져올 때 데이터의 컬럼 타입과 컬럼명 동일한 경우 자동으로 key로 인식하여 연결하는 것을 방지하기 위한 설정 변경 // Vendor별 실적 모니터링 / DATEDIFF // 기초재고와 기말재고 gap 모니터링 / Waterfall Chart / 매개변수
날짜, 요일별 판매 트렌드 모니터링(고객 판매 데이터) - 분해트리 / 컬럼 병합 / 공란 값 채우기 / 시계열 테이블 생성 - weeknum, weekday / 계기 차트 / KPI
ㄹㄹㄹㄹㄹㄹ