[TIL] H&M 데이터 분석 프로젝트 기획 1/2 (2024-07-22)

SHU·2024년 7월 22일
0

H&M 데이터 분석

목록 보기
1/8

드디어 최종 프로젝트 기획서 작성의 시간!
지난 주 금요일에 돌아가는 것까지 확인한 크롤링은 포폴 활용 적합성 이슈로 인해 코드를 버리고...문제의식은 유지한 채 케글에서 패션 커머스 데이터를 찾아 분석하기로 했다.

활용 데이터

Keggle - H&M Personalized Fashion Recommendations

H&M group에서 올린 competition의 dataset

데이터 구성

활용 데이터 : 4개 데이터셋

  • articles.csv
    각 article_id에 대한 상세 메타 데이터(상품 정보)
  • customer.csv
    데이터 세트의 각 customer_id에 대한 메타데이터(고객 정보)
  • transactions_train.csv
    각 고객이 각 날짜에 구입한 제품과 추가 정보로 구성된 데이터. 중복되는 행은 동일한 품목을 여러 번 구입한 경우에 해당(거래 정보)
  • images/
    article_id에 해당하는 상품 이미지

데이터 특징

  • transaction data에 transaction id 혹은 number, 주문 시간이 없음
  • price 컬럼의 값이 0.01~0.59로 전처리 된 것으로 보임
  • customer data의 postal code가 일반적이지 않은 형태이며, 값이 중복되는 경우가 다수 있음

프로젝트 배경 설정

실존하는 브랜드인 H&M의 데이터를 사용하는 것이기에 H&M의 현 상황을 조사

실제 현 상황

  • ZARA 등은 시장에 반향을 일으킨 일부 제품으로 시장에서의 주도권을 유지하고 있으며 최근 ‘쉬인’ 등의 중국 기업들이 패스트패션 분야에서 점유율을 확대 중. 이에 H&M은 고급화 전략, 저렴한 가격 양 측면에서 애매한 포지션에 처하게 됨. 그 결과, 수익 저조로 인해 CEO가 사임하고 주가가 폭락하는 하락세를 보이고 있음

가상의 상황 설정

  • 하락세를 타계하기 위해 고객 데이터 분석(개선) 전문가인 DR.재구매에게 자사의 3년간 고객 및 거래, 상품 데이터를 바탕으로 데이터 분석을 의뢰
  • 이에 우리는 고객관련 지표(리텐션, 객단가 등)을 확인 및 분석하고, 이를 개선할 수 있는 방안들을 제안하여 H&M을 다시 업계 1위의 자리로 끌어올리고자 함

오늘의 기록 - 좋은 협업이란 뭘까?🤔

상황 및 문제


  • A님이 생각하는 기획서 및 지금 당장 정해야 할 것과 다른 사람들이 생각하는 지금 당장 정해야 할 것의 정의 및 뎁스가 달랐음
    • 결과적으로 어떤 내용을 얼마나 작성해야 할지 난항을 겪음(시간이 버려짐)
  • 한 단어에 대한 공통의 합의가 이뤄지지 않음
    • ‘목적’이란 단어를 A님은 이걸 왜 하고 있지? 할 때마다 되짚을 포인트로, B님은 가장 큰 최종 목적으로 이해
    • 이로 인해 무엇을/어떻게 서술해야할지에 대한 혼란이 일어남

생각과 제안 가능한 솔루션


  • 우리의 소통 방식을 돌아볼 필요가 있는 것 같다!
  • 그라운드 룰을 정할 필요가 있다!
    ex) 소통에 난항이 있는 것 같을 땐 단어에 대한 공통 정의 내리고 다시 시작하기

분석 주제와 분석 방향 및 내용은 내일 이어서...

profile
슈의 코드뜨개질

0개의 댓글