이번에는 아파치 에어플로우를 ubuntu환경에서(putty를 활용하여) 설치해 보고 실제로 서버에 빌드해보는것을 해보려고 한다.
에어플로우는 삽지니어링2 Apach Nifi(아파치 나이파이)와 같이 데이터 파이프라인을 만들어주는 툴로서 나이파이 보다는 더 많은 사람들이 쓰고 있다.
현재 다니고 있는 회사에서도 에어플로우와 GCP를 같이 사용하고 있기 때문에 익숙한 툴이다.(하지만, 할줄 아는것과 익숙한것은 다르다 ^^...)
sudo apt update
sudo apt install python3-pip python3.10-venv
python3 -m venv venv
source venv/bin/activate
pip3 install apache-airflow
airflow db init
mkdir ~/airflow/dags
airflow users create --username admin --password admin --firstname Annonymous --lastname Admin --role Admin --email admin@example.org
여기서는 본인이 에어플로우에 로그인할 때 쓸 정보들을 커스텀해서 넣어주면된다. 임시로 admin으로 모두 만들어서 넣어준 모습이다.
airflow webserver --port 8081 # 포트번호는 본인이 원하는 포트로 하시면됩니다.
정상적으로 완료 되었을때 아래와 같은 모습이 우분투에서 보입니다.
{퍼블릭IPv4주소}:{포트번호}
정상적으로 입력했다면 아래와 같이 로그인창이 보일것이다.
삽질끝에 마주한 에어플로우 ㅠㅠㅠ 보고싶었어...
데이터 엔지니어링 툴은 설치가 제일 어려운것같아요...