데이터 베이스 가르키는 3가지 용어이며 회사마다 정의가 조금씩 다를 수 있고 회사의 사정에 따라 3가지 모두 있을 수도 일부분만 있을 수 있습니다.
개념적 크기 : Data Lake > Data WareHouse > Data Mart
Data Lake
- 다양한 원시적 형태의 데이터가 저장된 데이터 저장소이다. 데이터레이크는 저장에 목적을 두고 있고 데이터 형태가 다양하기 때문에 대부분 파일저장소나 Nosql을 이용하여 구축한다.
Data Warehouse
- 여러 데이터 소스로부터 ETL 과정을 거친 데이터들을 각 토픽에 따라 저장해 놓은 저장소이다. 전사적인 데이터를 제공하기 때문에 다양한 분석툴을 이용하여 비즈니스 의사결정에 사용된다.
Data Mart
- 데이터마트는 특정 부서에서 원하는 분석 목적에 필요한 데이터를 모아 놓은 저장소이다. 대부분 정형 데이터이기 때문에 대부분 관계형 데이터베이스를 이용하며 특정한 요구(목적)에 맞는 데이터마트를 구축함으로 데이터 분석가나 특정 부서에 보다 쉽게 데이터 제공이 가능하다.
참조.