Application level에서 DB선택과 modeling에 도움이 될만한 scope
AWS에서 개발한 데이터 웨어하우스 서비스이다. 데이터 웨어하우스로 쓰이는 만큼 OLAP에 최적화되어 있다.
Column 기반 storage가 뭘까 알아보자. Row 기반은 일반적인 DB가 디스크 블록에 데이터를 저장하는 방식이다. row 전체를 연속으로 저장한다. 반면 column 기반 방식은 컬럼별로 연속적으로 저장한다.
Cloumn 기반으로 데이터를 저장하면 OLAP 쿼리 특히 row전체를 필요로 하지 않고 특정 column 기반을 처리하는 query에서 디스크 I/O를 줄여주며 디스크에서 로드해야 하는 데이터의 크기가 줄어든다. 그러므로 매우 빠르며 효율적이다. 또한 데이터의 크기가 예측가능 해지고 유사하기 때문에 압축하기 용이해진다.
다만 row 전체를 다루는 쿼리 같은 경우에는 row 기반보다 불리하다.