데이터 웨어하우스(data warehouse)란 사용자의 의사 결정에 도움을 주기 위하여, 기간시스템의 DB에 축적된 대용량의 데이터를 공통의 형식으로 변환해서 관리하는 DB
Reliable Scalable하게 분산처리를 하기 위한 오픈소스 소프트웨어이다.
초기 빅데이터 플랫폼 초기에는 end-to-end로 각 서비스 애플케이션으로부터 데이터를 배치로 모았음. 데이터를 배치로 모으는 구조는 ? 유연 X 실시간으로 생성되는 데이터에 대한 인사이트를 서비스 애플리케이션에 빠르게 전달하지 못하는 단점 원
Data Warehouse > - 의사 결정을 위해 다양한 소스의 데이터를 분석 가능하고 구조화된 형식으로 저장하는 저장소 구조화된 데이터, 정형 데이터를 담는 레포지토리 대량의 데이터를 장기 보관 ETL 작업을 통해 여러 소스로부터 가져온 데이터를 테이블화 배치 작업