[TIL] [심화 프로젝트] 1일차: 주제 선정 및 ETA 작성

Donghyun·2024년 9월 2일
0

TIL (Today I Learned)

목록 보기
37/53
post-thumbnail

심화 프로젝트의 시작!

기초 프로젝트가 끝나고 이것저것 바쁘게 하다 보니 벌써 심화 프로젝트 기간이 됐다. 프로젝트를 여러 번 해봤음에도 도무지 적응되지 않는 이 프로젝트 초기의 긴장감...! 그래도 그 긴장감 덕분에 매번 진심을 다하게 되는 것 같다.

주제 선정

주제는?

이번 프로젝트는 저번 기초 프로젝트에서 조금 더 나아가 머신러닝 기법까지 사용해보는 심화 프로젝트! 가장 먼저 해야 할 일은 팀원들과 주제 선정하기. 주제 후보는??

개인적으로 하고싶었던 주제는 군집쪽이었다. 회귀랑 분류는 학교에서 프로젝트 하면서 다뤄봤는데, 군집은 처음이기 때문.

운이 좋게도 투표 결과 [군집] 마케팅데이터 - 고객 클러스터링이 당첨됐다. 그럼 이제 주제 선정 이유와 프로젝트의 개요를 작성해보자.

프로젝트 개요

주제 선정 이유

  • 초개인화 시대에 고객 개개인의 특성과 선호도를 반영한 맞춤형 서비스가 기업의 경쟁력을 좌우하고 있다.
  • 군집은 군집별로 마케팅과 캠페인을 맞춤화 할 수 있으므로 개개인의 특성을 충족시킬 수 있는 가장 적합한 분석방법으로 보인다.
  • 특히 B2C 도메인의 경우 고객 집단에 대한 분석을 통해 신제품 타켓팅마케팅 집단 타켓팅에 유용하다.

프로젝트 명

  • 군집분석을 통한 맞춤형 전략 개발

프로젝트 목표

  • 점점 더 고도화되는 고객들의 개인화 흐름을 충족시키기 위해 커머스 기업 ‘코팡’의 고객 데이터를 클러스터링 분석하여 새로운 고객 세그먼트를 발견.
  • 이를 바탕으로 페르소나를 활용한 맞춤형 마케팅 전략을 제안하여 마케팅 효율성을 극대화하는 것이 목표.
  • 데이터 탐색을 마친 후 페르소나별 구체적인 마케팅 전략을 설정한다.

프로젝트 핵심 내용

  1. 데이터 준비 및 전처리
    • CSV 파일 결합해 하나의 분석용 데이터셋 만들기.
  2. 탐색적 데이터 분석(EDA):
    • 데이터의 기본 통계량 확인
    • 컬럼별 분포 시각화
    • 상관계수 히트맵을 통해 변수 간 관계 분석
    • 이상치 탐지 및 분석
  3. 데이터 전처리
    • 결측치 처리
    • 이상치 처리
    • 스케일링
    • 인코딩
  4. 모델 구축:
    • K-means 등등 다양한 클러스터링 알고리즘 적용
    • 최적의 군집 수 결정 및 모델 성능 비교(엘보우, 실루엣 등)
  5. 클러스터링 결과 분석 및 시각화:
    • 각 군집의 특징을 도출하고 이를 시각화하여 인사이트 도출
    • 군집별 고객 페르소나 정의 및 마케팅 전략 제안
  6. 결과 보고:
    • 분석 결과를 종합하여 보고서 작성 및 데이터 리포트 툴(datapane)로 시각적 자료 제공
      • 튜터님과 상의 결과 그렇게 많이 사용 되지도 않고, 머신러닝에 집중하면 더 좋을 것 같다고 하셔서 삭제.

ETA 작성

저번 프로젝트 때도 느꼈지만, 프로젝트의 전반적인 흐름을 잡았다면 프로젝트별 ETA를 작성하는 작업이 필수적인 것 같다. 물론 ETA 는 Estimated Time of Arrival로 예상일 뿐 실제로 지켜지기 어려울 수 있지만 그냥 프로젝트에 박치기하는 것보다 일정 관리진행 상황 모니터링 등을 효율적으로 할 수 있게 도와준다. 다시 말해 쓸데없는 일 하는 걸 줄여준다.😁

심화 프로젝트 ETA

  1. 주제 선정 및 ETA 작성
    • 2024.08.22
  2. 데이터 통합 / 탐색적 데이터 분석(EDA)
    • 2024.08.23 → 2024.08.25
  3. 데이터 전처리
    • 2024.08.25
  4. 모델 구축 / 클러스터링 결과 분석 및 시각화
    • 2024.08.26 ~ 2024.08.27
  5. 발표 준비
    • 2024.08.28 ~ 2024.08.29

오늘의 다짐

  • 언제나처럼 쉽지 않겠지만, 쉽지 않기 때문에 재밌는 거 아니겠어? 최선을 다해 이번 프로젝트도 잘 마무리해 보자!

내일 할 일

  1. 분석을 위해 여러 데이터 파일을 하나의 통합 파일로 만들기.
  2. EDA
profile
데이터분석 공부 일기~!

0개의 댓글