데이터 웨어하우스
데이터 레이크
ETL (extract transform load)
ELT (extract load transform)
데이터 웨어하우스의 구성 예시
데이터 플랫폼의 발전단계
초기 단계 : 데이터 웨어하우스 + ETL
발전 단계 : 데이터 양 증가
성숙 단계 : 데이터 활용 증대
데이터 파이프라인
ETL, 데이터 웍플로우, DAG 모두 같은 말이다. 특히, Airflow에서 DAG라는 용어를 사용한다
결국 데이터를 소스(프로덕션 DB, 로그, ...)로부터 목적지(데이터 웨어하우스, 데이터 레이크, ...)로 복사하는 작업이다.
데이터 파이프라인을 크게 세 종류로 나누면 다음과 같다.