데이터 웨어하우스와 스타 스키마

이상민·2021년 8월 10일
0

[오늘의 배움]

목록 보기
60/70
post-thumbnail

1. 데이터 웨어하우스 관계형 데이터베이스

  • MySQL, PostgreSQL 같은 프로덕션 관계형 데이터베이스들은 빠른 처리 속도가 중요하다
    => OLTP

  • BigQuery, SnowFlake 같은 데이터 웨어하우스 관계형 데이터베이스는 큰 데이터를 처리하는 것이 중요하다
    => OLAP

  • 데이터 웨어하우스 RDBMS는 회사 관련 데이터를 저장하고 분석하기 위해 사용한다.

  • 데이터 웨어하우스 RDBMS도 SQL를 사용한다

  • 비정규화되어 클러스터로 구성된다


2. Star Schema 데이터 모델

가장 기초적인 형태의 데이터 마트 스키마

  • 데이터 마트 : 데이터 웨어하우스 환경을 위한 구조, 접근 패턴

  • 비즈니스 처리 데이터를 fact들로 분리하고 fact 테이블의 필드와 관련된 정보를 담는 dimensions 테이블로 구성한다

2-1. 장점

정규화 수준이 낮아 조인 연산이 적게 필요해 다음과 같은 장점을 지닌다

  • 간단한 쿼리문

  • 높은 쿼리 성능

  • 빠른 집계

2-2. 단점

정규화 수준이 낮아 다음과 같은 단점을 지닌다

  • 복잡한 쿼리 : 특정한 목적을 가진 fact 테이블 위주로 구성돼 해당 목적을 벗어난 복잡한 쿼리는 어렵다

  • 다 대 다 관계 : 객체간 다 대 다 연관을 표현하기 어렵다

  • 데이터 무결성 : 높은 수준의 정규화된 데이터베이스에 비해 무결성 보장이 어렵다


출처

https://en.wikipedia.org/wiki/Star_schema

profile
편하게 읽기 좋은 단위의 포스트를 추구하는 개발자입니다

0개의 댓글