MLOps 개념 정리

leehs·2022년 5월 20일
0

mlops

목록 보기
2/2

MLOps

MLOps 란?

"MLOps or ML Ops is a set of practices that aims to deploy and maintain machine learning models in production reliably and efficiently."

MLOps 는 프로덕션 환경에서 머신러닝 학습 모델을 안정적이고 효율적으로 배포하고,
유지관리 하는 것을 목표로 하는 것

ref: Breuel, Cristiano. "ML Ops: Machine Learning as an Engineering Discipline". Towards Data Science. Retrieved 6 July 2021.

  • Machine Learning 의 'ML'과 DevOps 의 합성어
  • 데이터 저장 관리부터 학습 환경 구성, 동시 학습 자동화, 테스트 그리고 프로덕션 시스템 전환까지 전 과정에 관여
  • DevOps 나 DataOps 와 유사하게 MLOps 는 일련의 과정을 자동화하고 생산 모델의 품질을 개선
  • 사업적 요소와 규제 등의 요구 사항에 대한 대응 역할도 맡음

MLOps 필요성

  • AI는 아직까지도 산업계보다 연구계로 알려져있고, 실제 서비스 운영을 위한 AI 개발자나 운영자가 부족함
  • AI 분야에서 기술 부채가 쌓이는 것을 방지하고, AI 시스템을 효율화하고 최적화하는 역할이 필요함
  • 예로, 시스템 디자인 데이터 의존성 문제 / 숨겨진 피드백 반복 로직 / 불필요한 참조 / 설정 문제 / 디버깅, 장애 추적 문제 등이 있음

ref: google, Hidden Technical Debt in Machine Learning Systems. NIPS.
Sculley, D & Holt, Gary & Golovin, Daniel & Davydov, Eugene & Phillips, Todd & Ebner, Dietmar & Chaudhary, Vinay & Young, Michael & Dennison, Dan. (2015). Hidden Technical Debt in Machine Learning Systems. NIPS. 2494-2502.

review: https://norman3.github.io/papers/docs/hidden_technical_debt.html

MLOps 목표

  • 배포 및 자동화
  • 특정 모델과 가중치의 재현
  • 각종 장애나 설치 등의 트러블슈팅
  • 거버넌스 및 규정 준수
  • 확장성 (Scale-up, Scale-out)
  • 각종 부서 간의 협업
  • 비즈니스 의사소통
  • 모니터링 및 관리

ref: Walsh, Nick. "The Rise of Quant-Oriented Devs & The Need for Standardized MLOps". Slides. Nick Walsh. Retrieved 1 January 2018.

0개의 댓글