두 개념 모두 추출 - 변환 - 적재의 과정을 거친다.
그 중에서 차이점은 이름 그대로에서 나와 있듯이 변환과 적재의 순서이다.
ETL은 행과 열이 존재하는 정형데이터에 가장 적합하다.
반대로 ELT는 비정형 데이터를 비롯한 모든 유형의 데이터를 처리한다.
ELT > ETL
ETL은 데이터를 대상에 적재하기 전에 추가 단계를 거쳐야 하는데, 이 단계는 확장이 어렵고 데이터 크기가 커질수록 시스템 속도가 느려진다.
반대로 ELT는 데이터를 대상 시스템에 직접 적재하고 병렬로 전환합니다
ETL < ELT
ETL 프로세스에는 처음부터 분석 팀의 개입이 필요하지만, ELT는 모든 전환이 대상 데이터 웨어하우스 내에서 이루어지기 때문에 ETL보다 필요한 시스템 수가 적다.
여기까지 AWS 에서 제공한 레퍼런스를 살펴보면 ELT가 ETL 보다 우수한 과정이 아닌가 하는 생각이 든다.
그러나 다음의 경우에 대해서는 ETL을 고려할 수 있다고 한다.
레거시 데이터베이스 : 기존의 과정을 변환하는 것에 대한 비용 문제
실험 : ETL은 데이터 실험을 통해 데이터 베이스를 이해하고 특정 시나리오에서의 유용성을 이해하는데 유용.
복잡한 분석 : 분석 효율성을 위해 ELT ETL을 같이 사용하는 경우
IoT 애플리케이션 : 센서 데이터 스트림의 경우 ETL 사용시 대역폭과 네트워크 부하 감소의 이점이 있다. 필요 데이터만 보내는 것이 응답시간을 개선시킬 수 있음.