profile
notion으로 이사갔어요
post-thumbnail

Airflow 살펴보기 1

Batch process 데이터 엔지니어링이나 ML모델을 서비스하다보면 주기적으로 어떤 작업을 실행하고 싶을 때가 많다고 한다. 예) 월요일 아침마다 쌓인 데이터로 자동으로 보고서를 생성해야할 때 한 달마다 ML모델을 주기적으로 재학습 시킬 때(continous training) Batch serving을 해야 할 때( Online serving) 이렇게 주기적으로 실행되는 프로세스를 Batch process라고 한다. 리눅스 Crontab 사실 기본 리눅스에는 Batch Process를 할 수 있게 해주는 crontab이라는 것이 있다. 리눅스 환경에서 를 입력하면 에디터가 하나 켜지는데 에디터 안에서 크론 표현식과 실행할 파일을 입력하면 주기적으로 실행이 된다. 크론 표현식은 주기를 정의하는 일종의 표현식인데 5가지 구성요소로 되어 있다. \* \* \* \* \* 순서대로 분, 시, 일, 달, 요일이며 위의 별

2022년 1월 12일
·
0개의 댓글
·

BentoML 살펴보기

Serving 라이브러리, BentoML이란? BentoML같은 serving 라이브러리가 없을 땐 AI 모델을 이용한 서비스를 배포하기 위해 FastAPI와 같은 것을 이용해 직접 API를 만들곤 했다. FastAPI로 백엔드를 구현하려면 따로 알아야 할 것들도 있고(그래도 언젠간 알아야 되는 것들이다.) 배포해야 하는 모델이 많아진다면 신경써야 하는 것도, 반복되는 코드 양도 늘어난다. BentoML나 Seldoncore같은 serving 라이브러리들은 백엔드 프로그래밍 과정을 최대한 줄이고 모델 배포 과정을 추상화하여 이전보다 빠르게 배포할 수 있게 해준다. BentoML의 특징은 다음과 같다. 유연하고 쉬운 사용성 다양한 ML 프레임워크를 지원(Tensorflow, Pytorch, Ke

2022년 1월 11일
·
0개의 댓글
·