2. 데이터셋 소개
통계청 온라인 쇼핑 동향
이번 분석에서 활용할 데이터는 통계청에서 매월 발표하는 온라인 쇼핑 동향 자료입니다.
이 데이터는 우리나라 온라인 쇼핑 시장의 규모와 트렌드를 파악할 수 있는 대표적인 자료로, 비즈니스 분석 및 시장 이해에 널리 활용됩니다.
주요 특징
- 데이터의 활용 목적
- 온라인 쇼핑 시장 규모를 논할 때 필수적인 자료입니다.
- 주요 질문에 답을 제공합니다:
- 어떤 카테고리의 거래액이 가장 높은가?
- 전년 대비 가장 크게 성장한 카테고리는 무엇인가?
- 주요 항목 및 구성
- 온라인 쇼핑 거래액
- 판매 매체: 모바일 쇼핑, 인터넷 쇼핑
- 취급 범위: 종합몰, 전문몰
- 운영 형태: 온라인 전용, 온·오프라인 복합
- 단위: 백만 원
- 업데이트 주기
- 매월 M-2 데이터를 기준으로 최신 자료가 업로드됩니다.
- 각 카테고리(상품군)별 거래액 데이터가 제공됩니다.
데이터셋의 한계와 보완 과제
현재 데이터셋은 그대로 활용하기 어렵습니다. 그 이유는 다음과 같습니다:
- 집계 완료된 형태이미 총합 및 중간 집계값이 포함되어 있어 세부 분석이 어렵습니다.
- 카테고리 세분화 부족예: "가전, 전자, 통신기기"와 같은 카테고리가 더 구체화되어야 합니다.
- 날짜 컬럼의 양식 불일치날짜 데이터가 일관되지 않아 정규화 과정이 필요합니다.
다음 단계
데이터 전처리를 통해 문제를 해결하고, Python을 활용해 분석 가능한 형태로 변환할 예정입니다. 이후, Tableau와 Looker Studio를 활용한 시각화를 진행하며 시장 동향을 깊이 파악해 보겠습니다.