사용할 데이터셋
Historical Sales and Active Inventory (출처 : kaggle)
컬럼 정의
- Order : 주문번호
- File_Type : Historical / Active
- SKU_number : 상품 고유번호
- SoldFlag : 지난 6개월간 판매된 적이 있으면 1, 없으면 0
- SoldCount : 판매량 (지난 6개월동안의 판매량이라고 가정)
- ItemCount : 재고량
- New_Release_Flag : 미래에 동일한 sku가 재입고된 적이 있으면 1, 없으면 0
- ReleaseYear : 출시년도 (입고년도라고 가정)
- PriceReg : 정상 판매가 / LowNetPrice : 고객 최종 실 구매가
분석 목표 : 악성 재고 현황 파악 및 최소화 플랜 수립
DBeaver 실행 - Database 생성(inventory) - 데이터 가져온 후 sql 편집기 실행
스키마를 'inventory'로 지정해주면 FROM 절 'inventory.inventory'에서 앞의 invertory 생략 가능 (같이 써도 결과는 동일)
SELECT count(*)
FROM (
SELECT DISTINCT *
FROM inventory i
) i2;
재고 활성화 확인
→ Active는 활성 재고라 soldflag가 null값, historical이 0과 1로 나뉨
SELECT DISTINCT File_Type, SoldFlag
FROM inventory i;
SELECT *
FROM inventory i
WHERE SKU_number = 294185;
판매가격 최대, 최소, 평균 확인
→ 최소값이 0인 데이터 有 > LowNetPrice 참고해볼 수 있겠다
SELECT min(PriceReg), max(PriceReg), avg(PriceReg)
FROM inventory i ;
