Airbnb(에어비앤비)에서 만든 배치 중심 워크플로우를 구축, 실행 및 모니터링 하기 위한 오픈 소스 플랫폼
Airflow의 구조
Webserver
Scheduler
Executor
Workers
Database
DAG(Directed Acyclic Graph)
@once
1회만 실행하도록 스케줄@hourly
매시간 변경 시 1회 실행@daily
매일 자정에 1회 실행@weekly
매주 일요일 자정에 1회 실행@monthly
매월 1일 자정에 1회 실행@yearly
매년 1월 1일 자정에 1회 실행schedule_interval=dt.timedelta(days=3)
← 3일에 한 번timedelta(minutes=10)
, 시간은 timedelta(hours=2)
* * * * *
45 5 * * 5
0,20,40 * * * *
0-30 1 * * *
*/10 * * * *
*/10 2,3,4 5-6 * *
Airflow 2 부터 쓸만한 REST API를 제공 (2020.12)
특징
Swagger, redoc을 제공
인증을 활용한 보안 (Airflow 2 이상)
모든 Airflow 자원에 대해서 CRUD를 지원
기능
API Endpoints 일부 소개
https://airflow.apache.org/docs/apache-airflow/stable/index.html
https://devchul.tistory.com/35
https://lsjsj92.tistory.com/631
https://blog.naver.com/PostView.naver?blogId=pjt3591oo&logNo=222517292174
https://medium.com/daria-blog/mlops-%EB%9E%80-%EB%AC%B4%EC%97%87%EC%9D%BC%EA%B9%8C-7ba8d9aae221
https://medium.com/daria-blog/%EB%AA%A8%EB%8D%B8-%EC%84%9C%EB%B9%99%EC%9D%B4%EB%9E%80-21f970e6cfa5
https://velog.io/@khs0415p/MLOps-Airflow
https://airflow.apache.org/docs/apache-airflow/stable/stable-rest-api-ref.html