DataWarehouse VS DataLake

Oni·2023년 7월 10일

DataWarehouse VS DataLake


[ 출처 | n-ix ]

분석용 데이터마트에는 원천(Source)가 존재한다.
Source에서 출발한 데이터를 포맷에 맞게 가공을 하고 쌓느냐 혹은 쌓은 뒤 필요시 가공하느냐에 따라 다르다.

데이터 웨어하우스(DataWarehouse)

  • 데이터 웨어하우스는 데이터를 쌓기 전에 포맷에 맞게 변형하여 저장하는 방식을 의미한다.
  • 포맷에 맞춰야 하므로 이는 결국 정형데이터인 경우 적합하다.

데이터 레이크(DataLake)

  • 데이터레이크는 데이터를 일단 저장한 뒤 필요 시 처리한다.
  • 포맷에 맞추기 어려운 비정형데이터에 적합하다.

출처

이미지 ) https://www.n-ix.com/data-lake-vs-data-warehouse/

참고 : 다양한 E.T.L 구조

https://sqlofthenorth.blog/2021/03/29/elt-etl-design-patterns-with-azure-data-services/

profile
데이터 분석/엔지니어링/ML에 관한 기록

0개의 댓글