MLOps = ML (Machine Learning) + Ops (Operations)
: 머신러닝 모델을 운영하면서 반복적으로 필요한 업무를 자동화 시키는 과정. 머신러닝 엔지니어링 + 데이터 엔지니어링 + 클라우드 + 인프라.
Server Infra
GPU Infra
Serving
Batch serving: 많은 데이터를 일정주기로 한꺼번에 서빙
Online Serving: 실시간 예측, 병목이 있으면 안됨
Experiment, Model Management
Feature Store
Data validation
Continuous Training
Monitoring: 모델의 지표, 인프라 성능 지표
Auto ML