Wikipidia 발
Data Engineering
은
데이터를수집
하고사용
할 수 있도록 시스템을 구축하는 것이 데이터는 일반적으로 후속 분석 및 데이터 과학을 가능하게 하는데 사용된다.
수집
Batch
또는 Streaming
시스템 구축
분석, 데이터 과학
데이터 처리
- 데이터 파이프라인 설계, 구축, 운영
- 인프라 관리
- 데이터 가공
- 데이터 웨어하우스 구축, 운영
- 데이터 연동
- ETL/ELT 처리
- 데이터 분석가 및 ML 업무 지원
- 장애 대응 모니터링, 알림
나의 생각은,
Data를 활용하는 작업을 위한 인프라, 파이프라인 관리
+
시스템 인프라 엔지니어의 역할도 점차 확장되고 있음을 느낌.
(Docker, K8S, DevOps[아마 MLOps로의 확장] 등등...)