- 회사에서 AI 모델을 개발하는 것이 수업에서 듣는 내용과 무엇이 다른지 살펴본다
- 가장 큰 차이점은 데이터셋과 평가 방법이 준비되어 있지 않다는 것이다
- 학습 데이터셋을 준비할 때 실제 회사에서는 어떤 일을 겪게 되는지 자세히 살펴보고, 해당 데이터셋을 학습된 모델의 성능을 평가할 때는 어떠한 점을 고려해야 하는지 사례 중심으로 설명한다
- 또한, 이러한 업무들의 효율적인 진행을 위한 조직 구성도 제안하면서, AI 상품화 과정 속에 필요한 전체 업무 리스트를 정리해 본다
- 마지막으로, AI 입문자에게 도움이 될 만한 조언들로 마무리한다
- 서비스에서 사용되는 AI 모델 개발 일은 현재 수업에서 배우고 있는 AI 모델 개발과 무엇이 다른가?
서비스 개발 시에는 학습 데이터셋도 없고, 테스트 데이터셋과 테스트 방법도 없다
서비스 개발 시에는 서비스 요구 사항만이 있다
그래서, 첫 번째로 해야 할 일은 학습 데이터셋 을 준비하는 것이다
그런데, 모델 파이프 라인 설계 하려면 어느 정도 데이터가 있어야 한다!
자! 본인이 학습 데이터셋 준비 담당자라고 해보고, 어떤 일을 겪게 되는지 살펴보자
테스트 데이터셋은 학습 데이터셋에서 일부 사용한다고 하고, (사실은 이것도 할 얘기가 많지만..) 서비스 요구사항으로부터 테스트 방법을 도출해야 한다
이것도 이해를 위해서 하나 예시를 들어 보자!
이때 AI 모델의 입출력은 다음과 같다
이 AI를 학습시키기 위해서 프로게이머들의 로그를 받아서 AI를 학습시켰다
결과는 완패!!
이렇게 실 서비스 적용 전에 개발 환경에서의 정량 평가와 (OFFLINE 테스트) 실 서비스 적용 시에 정량 평가는 (ONLINE 테스트) 이질감이 굉장히 클 수 있다
결국, 서비스에서의 품질이 중요하기 때문에 OFFLINE 테스트 결과가 ONLINE 테스트 결과와 유사하게 OFFLINE 테스트를 잘 설계해야 한다
테스트 방법에 대해 다음처럼 정리할 수 있다
추가로, 모델에 관련한 요구사항을 도출해야 한다
처리 시간 / 목표 정확도
목표 qps
Serving 방식 / 장비 사양
AI 모델 개발에는 수업에서 익히는 것 외에 정말 많은 일들이 존재
- 서비스에서 사용되는 AI 모델을 개발하기 위한 바람직한 조직 구성
- AI쪽으로 커리어를 쌓고자 하시는 분들에게 드리고 싶은 말씀