온라인 마켓플레이스에서는 하나의 상품이 단일 판매자에 의해 판매되기도 하지만, 여러 판매자가 동일한 상품을 유통하는 경우도 흔하다. 또한 시간이 지나면서 동일한 상품의 판매 가격은 시장 상황, 프로모션, 경쟁 등 다양한 요인에 따라 변화하게 된다. 이번 EDA에서는 상품별로 판매된 가격의 변동 양상을 중심으로 데이터를 탐색했다. 특히, 여러 판매자가 유통한 상품의 경우 판매자별 가격 전략 차이도 함께 살펴보았다.
먼저, 각 상품이 몇 가지 가격으로 판매되었는지를 기준으로 분포를 확인했다.
product_id
를 기준으로 price
의 고유값 수(price_count
)를 계산해, 상품별로 얼마나 다양한 가격으로 팔렸는지를 파악했다.price_count | count |
---|---|
1 | 27051 |
2 | 4124 |
3 | 1048 |
4 | 386 |
5 | 141 |
6 | 75 |
7 | 44 |
8 | 30 |
9 | 10 |
10 | 7 |
11 | 6 |
12 | 6 |
13 | 7 |
14 | 2 |
15 | 1 |
16 | 1 |
17 | 2 |
20 | 2 |
21 | 3 |
23 | 2 |
27 | 1 |
29 | 1 |
31 | 1 |
분석 정확도를 높이기 위해, 다음 네 가지 컬럼을 기준으로 유니크 데이터만 추출하였다.
컬럼명: 상품 아이디, 판매된 가격, 판매된 날짜, 판매자 아이디
price_count = 31
인 상품 중 첫번째 상품가장 다양한 가격으로 팔린 상품 중 하나를 선정해, 판매자별 가격 추이를 시각화했다.
price_count = 14
인 상품 중 첫번째 상품한 명의 판매자가 여러 가격으로 상품을 판매한 경우를 분석했다.
이 분석을 통해 olist의 데이터는 상품 하나가 단일 가격에 고정되지 않고 판매자나 시점에 따라 다양한 가격으로 유통된다는 점을 확인할 수 있었다. 특히, 판매자별 가격 전략이 판매 시작 시점, 종료 시점, 최고/최저가 운용 방식 등에 따라 크게 다르다는 점이 발견 되었다.