5주차 Product Serving 정리

kimkihoon·2022년 2월 17일
0

부스트캠프 AI

목록 보기
14/49

문제 정의의 중요성

문제를 잘 풀기 위해선 문제정의가 중요하다. How보단 Why에 집중한다.
해결해야 하는 문제는 무엇이고 그것을 해결하면 무엇이 좋을지 어떻게 해결하면 좋을지 고민해본다.

프로젝트 Flow

문제를 해결하기위한 Flow로 다음과 같이 나눌 수 있다.

현상파악
목적, 문제 정의 => 계속,쪼개서 생각하기
프로젝트 설계
Action
추가 원인 분석

현상 파악

  • 어떤 현상이 발견되었는지 상황을 파악한다.

구체적인 문제 정의

  • 앞선 현상을 더 구체적으로 명확한 용어로 정리해본다.
    ex) "메뉴가 너무 다양해서 선정하기 어렵다"
    원인
  • 메뉴가 다양하고 설명이 부족하다
    해결방안
    메뉴를 줄인다. => 일시적인 해결만 가능
    설명을 늘린다. => 즉시 수정 가능한 요소로 상황에 따라 어떤 음식을 먹으면 좋은지 가이드를 줄 수 있다.
    결론
    데이터로 할 수 있는 일을 만들어 진행하되, 무조건 알고리즘 접근이 최상은 아니라는 방법을 제시할 수 있어야 함.

    문제를 쪼개서 파악
    문제의 해결 방식은 다양함
    데이터로 해결가능한 것을 고민해보기
    점진적으로 실행

프로젝트 설계

문제 정의 후, 프로젝트 설계를 최대한 구체적으로 해야함

해결하려고 하는 문제 구체화
머신러닝 문제 타당성 확인
목표 설정, 지표 결정

제약 조건
베이스라인, 프로토타입
평가 방법 설계

머신러닝 문제는 데이터로부터 어떤 함수를 학습하는 것으로 그 문제의 타당성을 평가할 때에는 필요한 데이터의 종류나 기존 모델이 있는지 살펴보아야 한다.

머신러닝이 사용되면 좋은 경우

  • 패턴 : 학습할 수 있는 패턴이 있는 경우
  • 목적함수 : 학습을 위한 목적 함수를 만들 수 있어야 함
  • 복잡성 : 패턴이 복잡해야 함
  • 데이터 존재 여부 : 데이터가 존재하거나 수집할 수 있어야 함
  • 반복 : 사람이 반복적으로 실행하는 경우

목표를 설정하여 데이터를 확인해야 한다. => 지표와 연결되는 내용이기 떄문

  • label을 가진 데이터가 있는 경우 => 바로 사용
  • 유사 label을 가진 데이터가 있는 경우 => 음악 스트리밍에서 재생, 건너뛰기 기록은 선호도를 예측하기 위한 유사 label에 해당함
  • Label이 없는 데이터 => 직접 레이블링 or 레이블링이 없는 상태에서 학습하는 방법 찾기
  • 데이터가 아예 없는 경우 => 데이터 수집 방법을 고민함

목표가 여러개인 경우에는 분리하는 것이 좋다.

모델 개발 후 배포 & 모니터링

앞저 정의한 지표가 어떻게 변하는지 파악한다.

0개의 댓글