1) 데이터 수집 및 저장 2) 데이터준비 3)탐색 및 시각화 4)실험과 예측
데이터 엔지니어 1 / 데이터 분석가 or 데이터사이언티스트 2,3,4

[출처. datacamp]

[출처. datacamp]
추가)
데이터 사이언티스트가 최신의 정확한 관련 데이터를 사용할 수 있도록 한 스테이션에서 다음 스테이션으로의 흐름을 효율적으로 자동화하는 데이터 파이프라인이 필요
E :extract / Source에 접근을 해서 데이터를 추출해 오는 단계
T : Transform extracted data / 추출이 된 데이터를 목표한 저장공간에 보내기 위해 변환하는 단계
L: Load transformed data to another database
추출과 그리고 변환이 끝난 데이터들을 Target Repository에 저장하는 단계
--> 결론 : 다양한 소스에 존재하는 데이터를 데이터 저장소에 수집하고, 이를 사용자들의 용도에 맞게, 데이터를 변형하고 사용 가능한 곳으로 옮기는 프로세스
일반적으로 데이터 파이프라인은 한 시스템에서 다른 시스템으로 데이터를 이동
ex) 데이터는 변환되지 않고 시각화 도구나 Salesforce와 같은 애플리케이션으로 직접 라우팅될 수 있음