정의
- 의사결정에 도움을 주기위해 데이터베이스에 축적된 데이터를 공통의 형식으로 변환하여 관리하는 데이터베이스
- 특정 기간의 무수한 데이터를 select와 join으로 가져온다면 그 데이터베이스의 부하는 엄청나기 때문에 가공하여 운영DB로 추출하여 데이터 조회 및 분석을 위해 만든것 -> 데이터 웨어하우스
이점
- 정보 기반 의사결정을 도움
- 여러 소스의 데이터를 통합해서 분석 가능
- 과거 데이터 분석
- 데이터 품질, 일관성 및 정확성
- 트랜잭션 데이터 베이스와 분석 처리를 분리하여 두시스템의 모두의 성능을 향상
아키텍쳐
- ETL(Extract, Transform, Load)
- 데이터 웨어하우스 구축하는 과정에서 데이터를 추출하여 가공한후 데이터 웨어하우스에 적재하는 과정
- 필터링, 정렬, 집계, 데이터 조인, 데이터 정리, 중복제거 및 유효성 검사등의 작업
- Data Lake
- 정형, 반정형 및 비정형 데이터를 비롯한 모든 가공되지 않은 다양한 종류의 데이터를 한곳에 모아둔 중앙 리포지토리
- 빅데이터를 위해 다양한 영역의 데이터를 한곳에 모아 관리하고자 하는 것이 목적
- Data Mart
- 특정 팀 또는 사업단위의 요구를 충족시키기 위한 데이터 웨어하우스
- 규모가 작고, 집중적이며 사용자 커뮤니티에 가장 잘 맞는 데이터를 포함한다.
- 데이터 마트는 데이터 웨어하우스의 일부 일 수 있다.
특성
더 공부하기 - > http://www.jidum.com/jidums/view.do?jidumId=680
출처
https://aws.amazon.com/ko/what-is/data-warehouse/
https://bomwo.cc/posts/Datawarehouse/