Data Warehouse

yg kim·2023년 11월 7일
0

공부하기

목록 보기
14/14
post-custom-banner

정의

  • 의사결정에 도움을 주기위해 데이터베이스에 축적된 데이터를 공통의 형식으로 변환하여 관리하는 데이터베이스
  • 특정 기간의 무수한 데이터를 select와 join으로 가져온다면 그 데이터베이스의 부하는 엄청나기 때문에 가공하여 운영DB로 추출하여 데이터 조회 및 분석을 위해 만든것 -> 데이터 웨어하우스

이점

  • 정보 기반 의사결정을 도움
  • 여러 소스의 데이터를 통합해서 분석 가능
  • 과거 데이터 분석
  • 데이터 품질, 일관성 및 정확성
  • 트랜잭션 데이터 베이스와 분석 처리를 분리하여 두시스템의 모두의 성능을 향상

아키텍쳐

  • ETL(Extract, Transform, Load)
    • 데이터 웨어하우스 구축하는 과정에서 데이터를 추출하여 가공한후 데이터 웨어하우스에 적재하는 과정
    • 필터링, 정렬, 집계, 데이터 조인, 데이터 정리, 중복제거 및 유효성 검사등의 작업
  • Data Lake
    • 정형, 반정형 및 비정형 데이터를 비롯한 모든 가공되지 않은 다양한 종류의 데이터를 한곳에 모아둔 중앙 리포지토리
    • 빅데이터를 위해 다양한 영역의 데이터를 한곳에 모아 관리하고자 하는 것이 목적
  • Data Mart
    • 특정 팀 또는 사업단위의 요구를 충족시키기 위한 데이터 웨어하우스
    • 규모가 작고, 집중적이며 사용자 커뮤니티에 가장 잘 맞는 데이터를 포함한다.
    • 데이터 마트는 데이터 웨어하우스의 일부 일 수 있다.

특성

  • 절차 지향적
  • 통합
  • 비 휘발성
  • 시간 변이적

더 공부하기 - > http://www.jidum.com/jidums/view.do?jidumId=680
출처
https://aws.amazon.com/ko/what-is/data-warehouse/
https://bomwo.cc/posts/Datawarehouse/

profile
발전하고 싶은 사람
post-custom-banner

0개의 댓글