[TIL] 데이터 웨어하우스, 데이터 마트, 데이터 레이크 구분

승은·2024년 2월 3일
0

TIL

목록 보기
10/23

DA에 관심이 있기에 기본 개념정리를 해보려한다.✏️

데이터베이스를 가르키는 3가지 개념이 있다.

1️⃣ 데이터 웨어하우스 Data Warehouse

  • 여러 데이터 소스들로부터, ETL 과정을 거쳐 하나의 통합된 데이터 창고를 구축함.
  • 많은 양의 데이터를 오랫동안 보관하는 것에 최적화
  • 다양한 원천에서 발생하는 데이터를 소비자에게 전달하기 전에 통합하여 저장하는 공간
  • 업무적으로 중요한 데이터가 저장되고, 전사적인 관점에서 통합하여 관리

통합되는 과정에서 데이터를 정제하는 비용과 버려지는 데이터가 발생한다. 이러한 점이 데이터 레이크의 등장이 야기되는 지점이다.

2️⃣ 데이터 마트 Data Mart

  • 각 현업에서 사용하는 업무단위처럼 상세한 단위로 데이터를 저장하고 사용
  • 전사적인 데이터를 보관하는 데이터 웨어하우스와 달리, 특정 목적에 따라 추출하여 사용

3️⃣ 데이터 레이크 Data Lake

  • 다양한 원천을 하나의 통합된 형태로 정제한 DW(데이터 웨어하우스)와 달리, 다양한 원천을 그대로 가져와 저장하여 다양성을 보존하는 개념
  • Ad-hoc 분석과 머신러닝에 대한 분석 수요가 증가하면서, 가공되지 않은 형태의 데이터는 더 효율적으로 다양한 관점의 분석이 가능하다는 장점

사진출처
https://panoply.io/data-warehouse-guide/data-mart-vs-data-warehouse/
참고
https://mujilog.tistory.com/entry/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%9B%A8%EC%96%B4%ED%95%98%EC%9A%B0%EC%8A%A4%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%88%ED%8A%B8%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A0%88%EC%9D%B4%ED%81%AC-%EB%9E%80
https://ehyun0128.github.io/miscellaneous/dm_dw_dl/

0개의 댓글