ETL ์ด๋?
์ ์ ์กฐ๊ฑดPython, docker, docker compose \- Python 1) ์ต์ ๋ฒ์ ๋ค์ด๋ก๋ 2) ๋ก์ปฌ ์ค์น 3) ํ์ธAirFlow ์ค์น
airflow๋ฅผ ์ด์ฉํ์ฌ DAG๋ฅผ ์ ๊ธฐ์ ์ผ๋ก ๊ตฌ๋์ํค๋ ค๋ฉด๋ค์์ ์ฃผ์ํด์ผํ๋ค.start_dateDAG ๊ตฌ๋์ ๊ธฐ์ค์ ์ด ๋ ์๊ฐschedule_interval์ด๋ ์ฃผ๊ธฐ๋ก ์คํํ ์ง๋ง์ด๋ค ํท๊ฐ๋ฆฌ๋ ๊ฐ๋ ์ด start_date์ด๋ค.start_date๋ฅผ ์ง์ญํด์ ๋ฐ์๋ค์ด๋ฉด์ฐ๋ฆฌ๊ฐ ์
์์ 7์ฅ์์ ๋ฐฐ์ ๋ฏ์ด Airflow๋ ์ฌ๋ฌ ์ ํ์ ์์คํ ๋ค ๊ฐ์ ์ ์ ์ ์กฐ์จํ ๋ ์ฝ๊ฒ ํ์ฅํ ์ ์์ต๋๋ค.๋ง์ผ Airflow๊ฐ ์ง์ํ์ง ์๋ ์์คํ ์์ ํ์คํฌ๋ฅผ ์คํํด์ผํ ๊ฒฝ์ฐ ํน์ ๋จ์ ๋ฐ๋ณต์ ์ธ ์ฝ๋์ฌ์ ์ฌ๋ฌ DAG์์ ์ฌ์ฌ์ฉํ๊ธฐ ํ๋ค ์ ์์ต๋๋ค.์ด๋ด๊ฒฝ์ฐ ์ด๋ป๊ฒ
์ด๋ฒ์ฅ์์๋ Airflow๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ์ฌ๋ก๋ฅผ ํตํด ์์๋ณด์.DAG๋ฅผ ๊ตฌ์ฑํ๋ ํ์คํฌ๋ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ ์ ๋ณต์กํด์ง ์ ์์ต๋๋ค.์ต์ด ์์ฑ ์ดํ ๋ง์ ์์ ์ ๊ฑฐ์น๋ฉฐ ๊ธฐ๋ฅ์ด ์ถ๊ฐ๋ ์๋ก ์ง๋์น๊ฒ ๋ณต์กํด์ง๊ฑฐ๋ ๊ฐ๋ ์ฑ์ด ๋จ์ด์ง ์ ์์ต๋๋ค. ๐ ๊ฐ๋ฐ์๋ค