Schedular : 모든 DAG와 Task에 대하여 모니터링 및 관리, 실행해야 할 Task 관리
Web Server : airflow의 웹 UI서버
DAG : Python으로 작성한 워크플로우, 어떤 순서로 어떤 dependency로 실행할지 등의 정보 보유
Database : Airflow에존재하는 DAG와 Task들의 메타데이터를 저장하는 데이터베이스
Worker : 실제 Task를 실행하는 주체
pip install apache-airflow
airflow db init
airflow users create --username admin --password admin --firstname Anonymous --lastname Admin --role Admin --email test@test.com
airflow webserver &
airflow scheduler &
Airflow 명령어
- ps -ef | grep airflow : 현재 운영되고 있는 airflow 프로세스 목록 확인
- kill -9 pid : 프로세스 죽이기
- pkill -f airflow : 특정 이름이 들어간 프로세스 한 번에 죽이기
- airflow webserver --port:0000 : 0000번 포트로 바꿔서 webserver 진행