Airflow 소개

우상욱·2024년 3월 19일

Airflow Master Class

목록 보기
1/24

1. Airflow를 왜 배워야하는가?


  • 데이터 추출, 가공, 저장 분석 등 파이프라인을 관리할 수 있는 가장 인기가 많은 오픈소스 솔루션입니다.
  • Orchestration -> Automation
  • Luigi, Airflow, Kubeflow, MLflow, Argo 중 가장 인기가 많은 오케스트레이션 솔루션입니다.
  • 데이터엔지니어는 파이프라인을 구성하고 관리합니다.
  • 이 파이프라인의 핵심에는 에어플로우가 있습니다.

2. Airflow 소개


에어플로우는 파이썬을 이용해서 워크플로우를 만들고 관리할 수 있는 오픈소스 기반 워크플로우 관리 도구입니다. 2014년에 에어비앤비에서 만든 워크플로우 관리 솔루션입니다.

  • Airflow 특징
    • 파이썬으로 제작된 도구이며, 이용자가 워크플로우 생성시에도 파이썬으로 구현해야함
    • 하나의 워크플로우는 DAG(Directed Acyclic Graph) 이라 부르며 DAG 안에는 1개 이상의 Task가 존재
    • Task간 선후행 연결이 가능하되 순환하지 않고 방향성을 가짐(=DAG)
    • Cron 기반의 스케줄링
    • 모니터링 및 실패 작업에 대한 재실행 기능이 간편
profile
데이터엔지니어

0개의 댓글