[TIL#58 250526]

강민지·2025년 5월 26일

데이터분석_TIL

목록 보기
62/81

오랜만에 TIL,,
플젝하는 동안 TIL을 하나도 못썼다 ㅜ.ㅜ


Daily plan

🌞오전

- 9시 발제
- 최종 플젝 데이터 찾기 (주제 고민하기)
- SQLD 이론 공부

🔥 오후

- API 강의

🌝 저녁

- TIL 제출, 퇴실 확인!!

최종 프로젝트 주제 고민

카일분석_데이터 분석가 포트폴리오 주제 추천

캐글 같은 곳에서 좋은 데이터셋을 찾는 것도 좋지만,,
최종 플젝인만큼 '문제 정의'부터 시작해서 데이터도 직접 구해보고,
좀 더 일상에 가까운 데이터 분석을 해보고 싶다는 욕심이 생긴다.

(시카고 공공자전거, NBA, 뉴욕 에어비앤비, 어느 나라인지도 모를 이커머스 데이터... 이런 건 이제 그만......ㅎ)

이번 플젝은 두가지 중에 하나였으면 좋겠다는 개인적인 바람!

  • 직접 문제를 정의하고, 데이터 수집도 하면서 문제를 해결한 프로젝트
  • 회사에서 풀고 있는 문제와 유사한 프로젝트
    • 현업의 프로젝트 라이프 사이클과 유사한 진행 방식으로, 필요시 발표 이후에도 긴 기간동안 점진적 개선하는 방식이면 더 좋을 듯!
  • 이커머스로 한다면 캐글 데이터를 사용해야 할듯!
  • 마케팅은?
    • 캠페인 데이터도 괜찮을 거 같고
    • 퍼널 분석이나 전환/이탈 분석, 고객생애주기 등등 마케팅에서 자주 사용하는 고객 분석이 들어가면 좋을 것 같다는 의견!
  • 중요한건 컬럼 & 행 개수!

Product Data Science 1회차

프로덕트 데이터사이언스

  • 어떤 제품 기능이 사용자들에게 가장 유용한가?
  • 변화한 metric의 원인은 무엇인가?
  • A/B 테스트의 결과, 어떤 옵션을 선택해야 하는가?
  • 기회가 큰 시장은 어디인가?

해당 직무의 중요성

  • 데이터에 기반한 의사결정을 가능하게 함
  • 비즈니스와 사용자 경험의 균형을 맞추는 역할 수행
  • 회사의 성장 전략과 긴밀히 연결

Data analyst VS Data Scientist

  • Data Analyst
    • 주요 업무: 데이터 시각화, 보고서 작성, 성과 측정
    • 경영진이나 의사결정권자에게 과거 데이터의 의미를 전달
    • 주요 도구: SQL, Tableau, Excel
  • Product Data Scientist
    • 주요 업무: 문제 정의, 실험 설계 및 분석
    • 실험 결과를 기반으로 미래 행동 예측
    • 주요 도구: Python, SQL, 통계 기법

Data Scientist

  • Data Scientist
    • 주로 머신러닝 모델 개발 및 연구에 초점
    • 복잡한 데이터셋의 예측 모델 생성
    • 엔지니어링 팀과 협업해 모델을 프로덕션에 배포
  • Product Data Scientist
    • 제품 관련 메트릭 최적화와 실험 분석에 초점
    • 모델 개발보다 문제 정의 및 데이터 해석에 더 큰 비중을 둠

주요 업무

기회 규모 추정

: 특정 기능, 제품 개선, 새로운 시장 진출이 가져올 가치와 영향을 수치로 추정하는 것

  • 실무에서의 역할
    • 데이터 분석 -> 시장 데이터와 사용자 행동 데이터를 기반으로 추정
    • 가설 설정 -> 기회를 정량적으로 비교해 우선순위 결정

지표 설계

: 제품 및 비즈니스 성과를 측정하고 관리하기 위한 핵심 지표를 정의하고 체계적으로 설계하는 과정

  • 지표 유형
    • North Star Metric
    • Guardrail Metric
    • Input Metrics
  • 실무에서의 역할
    • 지표 설정 -> 세품/서비스 목표 달성을 위한 올바른 지표 정의
    • 지표 상관관계 분석 -> North Star Metric과 Input Metrics의 상관관계를 분석해 지표 신뢰성 확보
    • 모니터링 및 개선 -> Guardrail Metrics를 활용해 부정적 결과 조기 탐지 및 수정

메트릭 변동 딥다이브

  • 메트릭 변동: 제품 지표가 예상치 못하게 변화했을 때 그 원인 분석
  • 실무에서의 역할
    • 원인 분석 (Root Cause Analysis)
    • 데이터 시각화 -> 변동 요인을 명확히 파악하기 위함
    • 관련 팀과 협업

A/B 테스트 설계 및 분석

A/B test
: 제품의 두가지 버전을 사용자에게 무작위로 제공한 후 성과를 비교하는 실험 방법
-> 데이터 기반으로 의사결정을 내릴 수 있는 가장 신뢰도 높은 방법

  • 실무에서의 역할
    • 실험 설계: 가설 설정, 샘플 크기 계산, 실험군/대조군 정의
    • 결과 분석: p-value 계산, 효과 크기 추정, 비즈니스 인사이트 도출

하..... 현휘 앉으라니까.........

1개의 댓글

comment-user-thumbnail
2025년 5월 26일

ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 악마의 편집이다
아ㅋㅋㅋㅋㅋㅋㅋ 재밌네 흠..

답글 달기