SQL 데이터 분석 : 2.1. 이커머스 데이터 분석과 지표 / 2.2. 데이터셋 소개 / 2.3. 분석가들이 만나는 데이터 웨어하우스

yeppi1802·2024년 7월 18일

📖 주제 선정 이유

🔆 비즈니스는 측정되어야 한다

🔆 측정해야 하는이유

  • 분석가는 지표와 친하게 지내야 한다.
  1. 구체적인 목표
  2. 성공 여부 판단
  3. 우선 순위 / 개선

🔆 친하게 지내는 방법 = 접근할 수 있는 단위로 쪼개기

🔆 채용 공고에도 적힌 지표!


📖 데이터 셋

🔆 Brazilian E-Commerce Public Dataset by Olist

  • 약 10만 건의 실제 브라질 이커머스 주문 데이터
  • 주문 외에도 지리정보, 리뷰 등 다양한 데이터를 포함함
  • 기간 : 2016 ~ 2018
  • 참고. 샘플링 / 익명화 완료

🔆 쪼개져 있는 데이터 셋

  • 실무도 쪼개져 있을 수 있음

🔆 쪼개야 하는 이유?

  • 왜 왼쪽같이 한번에 합쳐진 상태면 더 편할 텐데? 오른쪽처럼 쪼개서 조인할까?

  • 예시 : 대형마트 판매 상품 정보
    • 1번 : 상품위치 정보가 바뀔때 마다 전체를 수정해야함
    • 2번 : 자주 바뀌는 것과 그렇지 않는것을 분리하여 한쪽 테이블만 변경하면 되기 때문에 효율적으로 관리 가능

🔆 그래서 쪼개져 있는 데이터

☁️ 실습에서 사용할 데이터 셋

📖 Data Warehouse

🔆 데이터 웨어하우스란?

  • 서버에 연결한 DATABASE들을 분석용 중앙 데이터 창고에 넣어둔 형태

0개의 댓글