[내일배움캠프] 41일

노경민·2025년 7월 14일
0

🧠 오늘의 학습 요약

🗂️ 공공데이터 수집법

  • 국내 주요 플랫폼: data.go.kr, 서울 열린데이터 광장, KOSIS, 기상자료개방포털, KTDB, AI HUB, 국토정보플랫폼, 부동산 통계, 금융 데이터 포털
  • 활용 장점: 무료, 신뢰성 높음, 다양한 분야 커버, AI/분석 학습 데이터로 최적
  • 활용 예시: 스마트시티, 부동산 예측, 정책 수립, 공공서비스 개선 등

👁️ Kaggle 탐색 및 활용법

  • 활동 흐름: 회원가입 → 프로필 설정 → Dataset 탐색 → Notebook 실행 → Competitions 참가

  • 검색 팁: 키워드 최적화("house price" vs "real estate"), Most Votes, Usability Score 필터 활용

  • 대표 데이터셋:

    • Titanic (이진 분류)
    • House Prices (회귀 예측)
    • MNIST (이미지 분류)
    • Netflix Shows (EDA, 추천)
    • COVID-19 (시계열 분석)

📖 논문 읽기 및 활용법

  • 읽는 전략 (Triage Reading):

    • 초록 → 서론 → 결론 → 필요 시 방법론
  • 논문 등급 체계:

    • 국내: KCI (등재지/후보지)
    • 해외: SCOPUS, SCI, SSCI 등
  • **사분위수(Q1~Q4)**로 저널 영향력 확인

  • 검색 플랫폼: RISS, KCI, DBpia, ScienceON, Google Scholar, PubMed, ScienceDirect, Web of Science, SCOPUS

🏆 공모전 참여 전략

  • 플랫폼: Dacon, AI Factory, LH COMPAS, AI Hub, 국립국어원, 디지털산업혁신플랫폼, Kaggle

  • 전략 포인트:

    • 적절한 대회 선택 (입문/중급/고급자용)
    • 협업 분업화: 데이터 전처리, 모델링, 최적화
    • “모델을 위한 분석”보다 “문제 해결”을 중심에 둘 것
    • Feature Engineering(스케일링, 인코딩, 생성, 선택)과 EDA는 실전 핵심
    • 모델 선택 및 하이퍼파라미터 튜닝 중요 (Optuna, GridSearchCV, Ensemble 전략 등)

🤖 아티클 스터티

사용자 행동 데이터 분석 : 2 넷플릭스와 아마존은 데이터 분석을 어떻게 할까요?

[주제]

사용자 행동 데이터를 활용한 서비스 개선 사례 분석

[아티클 요약]

  • 사용자 행동 데이터 분석의 의미와 활용 가능성
    • 사용자의 클릭, 스크롤, 체류 시간 등 활동을 추적하여 분석 가능.
    • 기능별 사용 순서, 이탈 페이지, 결제 행동, UI 변경 반응 등 다양한 인사이트를 도출할 수 있음.
  • 넷플릭스 사례
    • 어떤 콘텐츠를 제작해야 수익성과 반응이 좋을지 판단하기 위해 시청 데이터를 수집.
    • 시청 위치, 되감기/앞으로 감기 사용 여부, 재시청 시점 등의 데이터를 통해 콘텐츠 기획에 활용.
    • 예: ‘소셜 네트워크’ 끝까지 본 사람 → ‘하우스 오브 카드’의 감독작 선호 → 성공 가능성 높은 콘텐츠 제작.
  • 아마존 사례
    • 클릭 데이터로 웹사이트 로딩 속도와 구매율의 관계를 분석.
    • 0.1초 로딩 지연마다 구매율 1% 감소 → 0.6초 이하 로딩 목표 수립.
    • AI를 통해 관심사 기반 맞춤 페이지 구성 → 평균 구매 전환율 13% 달성 (국내 평균 6%).
  • 맞춤형 광고 사례
    • 유모차 광고를 20대 여성 타깃으로 설정했지만, 실제 구매자는 반려견 유모차 구매 의도의 중장년층 남성도 포함.
    • 검색/클릭/스크롤 데이터를 통해 진짜 관심 사용자에게 광고 노출 → 효율적인 마케팅 가능.
  • 다른 서비스에의 확장 – 뉴닉
    • 뉴스 콘텐츠 기업도 어떤 주제에 관심이 많은지 행동 데이터로 분석.
    • 클릭 수, 끝까지 읽은 기사, 10초 이상 머무른 글 등으로 인기 주제를 예측해 다음 콘텐츠 주제 선정에 활용.

[인사이트]
사용자 행동 데이터는 단순한 클릭 로그를 넘어서 비즈니스 전략과 수익성, 제품 개선에 직접적인 영향을 줄 수 있는 중요한 자산임을 확인했다. 넷플릭스와 아마존처럼 방대한 사용자 데이터를 기반으로 콘텐츠 기획이나 UX/UI 개선에 활용하면 경쟁력을 확보할 수 있다. 특히 잘못된 타깃 설정으로 비효율적인 광고비가 낭비될 수 있는 상황에서 행동 데이터를 기반으로 한 진짜 수요자 분석은 마케팅 효율을 획기적으로 높일 수 있는 핵심 전략이다. 이러한 분석은 콘텐츠 서비스, 이커머스, 뉴스 미디어 등 모든 사용자 기반 디지털 서비스에 확장 가능하다는 점에서 매우 강력한 도구이다.


🤔 느낀 점

오늘 학습을 통해 데이터 분석의 전 과정에 걸친 실전 전략을 체계적으로 정리할 수 있었다. 단순히 데이터를 구하고 모델링하는 기술을 넘어, 왜 이 데이터를 써야 하는가, 어떻게 문제 해결에 기여할 수 있는가라는 본질적인 질문을 던져야 한다는 점이 가장 인상 깊었다.

특히 공공데이터는 비용 없이도 다양한 분야의 고품질 데이터를 활용할 수 있다는 장점이 있어, 앞으로 진행할 프로젝트에 훌륭한 자원이라는 확신이 들었다. Kaggle을 비롯한 다양한 플랫폼의 활용법을 익힌 것도 실전 감각을 키우는 데 큰 도움이 되었다.

또한 넷플릭스와 아마존의 사용자 행동 데이터 분석 사례는 데이터 기반 의사결정의 강력함을 보여주었다. 단순 클릭 수를 넘어, 사용자의 '행동 맥락'을 분석해 제품 전략이나 광고 타겟팅까지 바꿀 수 있다는 점은 데이터 분석가로서 갖춰야 할 시야의 넓이를 다시 한번 깨닫게 해줬다.

앞으로는 기술적인 분석 능력뿐 아니라, 실제 문제 해결과 정책/비즈니스에 어떻게 연결할지 고민하는 자세를 놓치지 않아야겠다고 다짐했다.


🎯 내일의 목표

머신러닝 공부, 통계 복습

0개의 댓글