도메인현업에서는 이미 알고 있다시장/트렌드모두가 영향을 받는다경쟁사우리도 대응해야 한다진행방식: 파이썬 전처리 -> 태블로, looker studio로 시각화 -> 분석온라인 쇼핑에서는 어떤 카테고리의 거래액이 가장 높은가 ?전년 대비 어떤 카테고리가 가장 크게 성장했
이미 집계가 완료된 형태총합, 중간 집계값 존재가전,전자,통신기기 카테고리 세분화날짜 컬럼 양식 불일치df.melt()형태로도 가능이미 집계가 완료된 형태를 우리가 원하는 방식으로 바꾸기 위한 과정가로로 나열되어 있는 데이터를 세로로 나열되게 해줌id_vars : 유지
🚨 불러올 컬럼들을 이름이 아니라 인덱스로 적어주어야 오류가 나지 않음
Tableau 인터페이스차원과 측정값연속형과 불연속형DATEPARSE 함수Tableau 그래프(1)Tableau 그래프(2)대시보드참고. 도구설명과 대시보드 레이아웃Tableau 조인 & 관계
라인그래프를 이용하여 년도별 온라인쇼핑 거래액 그래프 그리기하이라이트 테이블을 이용하여 상품군별 거래액 및 거래액 비중(%) 그래프 그리기운영형태별 거래액 합계를 나타낸 표크기 설정 : 고정된 크기로 일반 데스크톱으로 설정운형형태별 거래액 가운데정렬너비 맞추기나 전체보
상품군별 필드를 필터에 넣기상품군별 아래 화살표 눌러서 필터 표시 체크상품군별 아래 화살표 → 워크시트에 적용 → 이 데이터 원본을 사용하는 모든 항목 체크보고 싶은 상품군만 선택해서 볼 수 있음 (다중값 목록)대시보드에서 둘 다에 적용 가능상품군별 아래 화살표 눌러서
하이라이트 테이블 너비 맞추기제목 숨기기2023년 데이터는 월 데이터가 부족하므로 대시보드에서 제거필터 → Date의 연도 → 값제외 → 2023년 제외워크시트에 적용 → 이 데이터 원본을 사용하는 모든 항목 선택대시보드에서 동작 선택동작 추가에서 필터 선택필터 동작

운영형태별, 취급상품범위별, 판매매체별 거래액을 상품군별로 보자먼저 운영형태별 거래액 그래프를 만든 후 복제하여 나머지도 만들자필터 적용하여 보기
개요인터페이스그래프참조선 & 매개변수날짜 변환 & 시계열 차트
선택하는 값에 따라 대시보드에 표시되어 있는 모든 차트들이 영향 받음기본적으로 적용되어 있고 on/off 가능표 선택 → 설정 → 차트상호작용대시보드에 있는 일부 차트에만 적용시키고 싶으면 command로 묶어서 그룹만들기태블로의 필터 기능과 비슷대시보드안에 모든 차트
분석가들은 지표와 친해야 함 (구체적인 목표, 성공 여부 판단, 우선순위 / 개선)접근할 수 있는 단위로 쪼개자 (큰 지표에서 작은 지표로 쪼개나가기)분석가들이 다루는 데이터들은 일반적으로 쪼개져 있음한 테이블에 모아두면 다른 데이터들이 수정될 때마다 전체 데이터가 업
Big Query Data Warehouse 조직 내 다양한 이질적인 소스의 정보를 집계하고 저장하는 시스템 최종 사용자가 서로 다른 소스의 정보를 통합 및 분석할 수 있게 함으로써 의사 결정을 도모할 수 있도록 설계됨 분석용 중앙 데이터 창고 Big Query
큰 지표에서 작은 지표로!총 거래액과 매출\*\* olist도 셀러가 있는 형태이기 때문에 매출은 수수료로 보는 것이 맞지만,지표를 처음 접하시는 분들을 위해서 자사몰로 가정하고, 판매된 총 금액(총거래액)을 매출로 사용하였습니다분석지표매출 → 주문수 건당주문금액주문
TIMESTAMP()에서는 시간대 설정 가능 (참고. 한국 시간대 : ‘Asia/Seoul’)날짜에서 일부분만 추출하고 싶을 때EXTRACT(‘추출할 부분’ FROM ‘날짜 컬럼’)DATE_TRUNC(‘날짜’, ‘남기는 부분’) DATETIME_TRUNC(‘날짜’, ‘
Column이 중요한 빅쿼리데이터 타입을 바꾸는 함수CAST ('값' AS '데이터타입')SAFE_CAST ('값' AS '데이터타입')에러가 있을 경우 에러를 발생시키지 않고 null로 반환함연산자 / 를 사용하여 나눈다면 error! -> SAFE_DIVIDE(X,
1. 주별 주문수와 고객수를 뽑아주세요. > 주(state)별 침투율을 확인하고, 침투율이 특히 낮은 지역을 중심으로 침투율을 개선해보려고 합니다. 이를 위해 주별 주문수와 고객수를 뽑아주세요. 2. 주(state)별 주문수를 고객수 Top 2인 상파울루(SP), 리
\[Tableau] 퀵테이블 계산
지표 요약 테이블 만들기측정값이름을 더블클릭하면 전체 측정값이름이 표시됨측정값이름을 필터에 올린후 필터 편집으로 원하는 측정값만 체크매출필드와 날짜필드를 이용해 라인 + 원 그래프 (이중축) 생성매출필드로 차이 막대그래프 생성생상은 두가지로 설정매개변수란?정해진 값을
보고서에 데이터 추가 → 데이터 연결에서 Big Query 선택맞춤 검색어 → 결제프로젝트에서 내가 쓰는 프로젝트 선택옆의 쿼리 작성란에 쿼리 입력 후 연결테마 및 레이아웃 사용 (두번째것 사용함)데이터 필드에서 스코어카드로 생성하고 싶은 필드를 캔버스로 드래그앤드랍사
폭 넓게 사용되는 고객 행동 데이터예시)프로덕트 기획문제 발굴 / 평가 및 개선신규 페이지의 반응률은? 기존 대비 증가하는지?마케팅매체 성과 관리 (퍼포먼스 마케팅) - 배너별 클릭률은?누구에게 어떤 푸시를 보낼까?온라인 뷰티 쇼핑몰의 고객 행동 데이터(’19 10월~
실제 현업에서는 상품을 구매까지 진행한 고객보다 방문자수가 훨씬 많음그러므로 고객들의 결제전까지의 행동을 알아보는 일이 많음고객행동분석은 데이터를 통해 고객들이 서비스를 어떻게 활용하는지 확인하는 것사용자가 특정 목표(예: 구매, 회원가입 등)를 달성하기까지의 과정을
우선 우리 쇼핑몰에 몇 명이 들어오는지 확인해야 해요→ 활성 유저 숫자 확인우리에게 중요한 행동은 몇 명이나 하는지도 알고 싶어요→ 중요한 행동이 뭘까? 모수와 비율을 전부 제공하자발생하는 거래액이 얼마인가요?→ 전체규모 (가능하다면) 상세정보 ※ 요청자와 충분한 검토
오픈소스다양한 DB 지원직관적인 인터페이스쉬운 Import & Export (CSV, Excel…)ERD 그리기Microsoft Business Intelligence Tool다양한 DB, Data Source ConnectionMS 친화 인터페이스 (Excel, Po
Google Drive 내에 Directory 만들기CSV 데이터셋 업로드하기Colab – ipynb 파일 생성Pandas 불러오기import pandas as pd기본 정보 체크df.columns : colum이름을 확인하거나 몇개인지 확인df.info() : 행,
Database(MySQL) 연결HR 이라는 새로운 Database를 생성Datatbases → Create new databaseHR Schema 우클릭 → 데이터 가져오기 (csv 파일 가져오기)Q) hr_employee_attrition 데이터에서 Python P