1. 데이터셋 개요
- 데이터 링크: Historical Sales and Active Inventory
- 내용:
- Historical: 이미 판매 이력이 있는 상품과 해당 판매량/가격 정보.
- Active: 현재 재고로 보유 중인 상품. 일부는 실제로 판매 이력이 없을 수도 있음.
- 일부 상품은 1년에 1번 팔릴까 말까 할 정도로 매우 판매가 저조한 케이스도 있음.
결과적으로 판매 이력이 있는 상품부터 사실상 ‘죽어 있는’ 재고까지 함께 들어 있기 때문에,
어떤 상품을 계속 보유하고, 어떤 상품을 정리(재고 처분)해야 할지를 고민하는 데 도움이 되는 데이터셋입니다.
2. 주요 컬럼 정의 (Dataset Column Definition)
다음은 데이터셋의 주요 컬럼 예시와 간단한 의미입니다:
- Order: 주문번호(또는 레코드 번호).
- File_Type:
Historical → 과거 판매 이력 데이터
Active → 현재 보유 재고
- SKU_number: 상품 고유 번호.
- SoldFlag: 지난 6개월 간 판매 이력이 있었는지 여부
- 1 → 판매 기록 있음
- 0 → 판매 기록 없음
- SoldCount: 판매량 (주로 최근 6개월 기준 판매량이라고 가정)
- ItemCount: 재고 수량.
- New_Release_Flag: 미래에 동일한 SKU가 재입고/출시될 예정인지 여부
- 1 → 신규로 다시 출시될 가능성 있음
- 0 → 예정 없음
- ReleaseYear: 상품 출시 연도 (입고된 시점 혹은 제조 연도로 가정)
- PriceReg / LowUserPrice / LowNetPrice:
- 정가(Regular Price)
- 고객 실 구매가 (LowUserPrice)
- 순수 비용(또는 할인/원가를 반영한 가격, LowNetPrice 등)
참고:
- 데이터셋 원문 기준으로, 정확한 컬럼명과 의미가 약간씩 다를 수 있습니다.
- 여기서는 예시로만 표기했으며, 실제 분석 시 각 컬럼의 값과 의미를 다시 한번 파악해봐야 합니다.
3. 분석 목표
- 악성 재고 현황 파악 및 최소화 플랜 수립
- “Active 재고 중 어느 상품이 오랫동안 안 팔리고 쌓여 있는가?”
- “Historical 데이터”로부터 어떤 아이템이 ‘장기적으로 잘 안 팔린다’는 사실을 알 수 있는가?
우리가 고민해볼 수 있는 포인트
- Historical / Active 재고가 차지하는 비중이 얼마나 되는가?
- *Historical 재고의 추산 가치(cost)**가 얼마나 되는가?
- 이 재고가 얼마나 오래 창고에 보관되어 있었나?(Aging)
- 모든 재고를 다 판다고 가정했을 때, 얼마나 시간이 더 필요한가?
- Historical 재고에도 등급을 세워(High, Medium, Low) 플랜 수립이 가능할까?
즉, 불필요하게 쌓여 있는 재고를 줄여 비용을 절감하고, 앞으로도 잘 팔릴 가능성이 낮은 상품은 처분 혹은 다른 방식으로 전환할 수 있는 전략을 세우고자 합니다.
4. 정리
- 이 데이터셋은 “활성 재고(Active Inventory)”와 “과거 판매이력(Historical)”이 함께 존재한다는 점이 특징입니다.
- 판매가 거의 없는 상품부터 꾸준히 팔리는 상품까지 다양하게 포함되어 있어, 재고 관리 측면에서 매우 흥미로운 케이스입니다.
- 이번 실습에서는 해당 데이터를 불러와, SKU별 판매 추이, 장기 재고 파악, 가치(cost) 분석 등을 진행하며, 불필요한 재고를 최소화할 수 있는 방안을 탐색해볼 계획입니다.
이상으로 Kaggle의 Historical Sales and Active Inventory 데이터 개요 및 분석 방향을 간단히 살펴보았습니다.