
데이터 소스에서 데이터를 추출하여, 필요에 따라 변환 과정을 수행해 데이터 웨어하우스에 적재하는 일련의 작업, 절차.
일반적으로 파이프라인의 형태로 구현되어 자동화하는 것을 목표로 함.
소스 데이터베이스에서 데이터를 추출
원시적인 데이터 소스 모두. 웹페이지, DB, File, APIs 등
추출한 데이터를 분석에 더 적합한 형태로 변환
여기서는
등을 통해 무결성/정합성을 높임
데이터를 대상 데이터베이스에 적재
파이프라인이 구성되면 배치 단위로 데이터를 데이터 웨어하우스에 적재함
왜 E, T, L이 구별되었을까?
작업의 성격에 맞는 자원을 할당하기 위해서 스테이지가 나누어졌다.
-> 주어진 자원과 작업의 성격에 따라 나누어야 할 문제
-> ELT 개념이 등장하는 이유