관계형 데이터베이스(RDB)는 사전에 엄격하게 정의된 DB schema를 요구하는 table 기반 데이터 구조를 갖습니다.
NoSQL(비관계형 데이터베이스)은 table 형식이 아닌 비정형 데이터를 저장할 수 있도록 지원합니다. RDB는 엄격한 schema로 인해 데이터 중복이 없기 때문에 데이터 update가 많을 때 유리합니다. NoSQL의 경우 데이터 중복으로 인해 데이터 update 시 모든 컬렉션에서 수정이 필요하기 때문에 update가 적고 조회가 많을 때 유리합니다.
NoSQL은 기존의 관계형 데이터베이스의 한계를 뛰어넘기 위해 만들어진 새로운 형태의 데이터베이스이며 관계형 데이터베이스보다 더 융통성 있는 데이터 모델을 사용하며, 데이터의 저장 및 검색에 특화된 메커니즘을 제공합니다. NoSQL은 분산 환경에서의 데이터 처리를 더욱 빠르게 하기 위해 개발되었습니다.
RDB(SQL) | NoSQL | |
---|---|---|
데이터 저장 모델 | table | json document / key-value / 그래프 등 |
개발 목적 | 데이터 중복 감소 | 애자일 / 확장가능성 / 수정가능성 |
예시 | Oracle, MySQL, PostgreSQL 등 | MongoDB, DynamoDB 등 |
Schema | 엄격한 데이터 구조 | 유연한 데이터 구조 |
⭐️장점⭐️ | • 명확한 데이터구조 보장 • 데이터 중복 없이 한 번만 저장(무결성) • 데이터 중복이 없어서 데이터 update 용이 • 데이터의 성능이 일반적으로 좋아 정렬, 탐색, 분류가 빠름 | • 유연하고 자유로운 데이터 구조 • 새로운 필드 추가 자유로움 • 수평적 확장(scale out) 용이 • 뛰어난 확장성으로 검색에 유리함. |
⭐️단점⭐️ | • 시스템이 커지면 join문이 많은 복잡한 query가 필요 • 수평적 확장이 까다로워 비용이 큰 수직적 확장(scale up)이 주로 사용됨 • 데이터 구조가 유연하지 못함 | • 데이터 중복 발생 가능 • 중복 데이터가 많기 때문에 데이터 변경 시 모든 컬렉션에서 수정이 필요함 • 명확한 데이터구조 보장 X |
⭐️사용⭐️ | • 데이터 구조가 변경될 여지가 없이 명확한 경우 • 데이터 update가 잦은 시스템(중복 데이터가 없으므로 변경에 유리) | • 정확한 데이터 구조가 정해지지 않은 경우 • Update가 자주 이루어지지 않은 경우(조회가 많은 경우) • 데이터 양이 매우 많은 경우(scale out 가능) |
특징 | • 트랜잭션(전부 아니면 무): 전체 트랜잭션이 하나의 단위로 기록. 실패 시 전체 롤백 • 정규화: DB설계 시 중복을 최소화해서 구조화하는 프로세스 | • 거대한 Map으로서 key-value 형식을 지원함. • 관계형 db와 달리 PK,FK JOIN등 관계를 정의하지 않음. • 스키마에 대한 정의가 없다. |
DB와 비교하여 NoSQL의 특징은 ACID, Transaction을 지원하지 않는다는 것입니다. RDB는 ACID와 Transaction을 보장하기 위해 수평적 확장이 쉽지가 않습니다. 또한 RDB 같은 경우에는 multiple server로 수평적 확장을 하게 되면 join을 하기 위해 굉장히 복잡한 과정이 필요합니다.
RDB도 수평적 확장이 가능하지만 NoSQL에 비해 훨씬 복잡합니다. RDB를 수평적 확장하려면 샤딩 (sharding)(데이터가 수평적으로 분할되고 기기의 모음 전반에 걸쳐 분산되는 경우)이 필요합니다.
ACID 준수를 유지하면서 RDB를 샤딩하는 것은 매우 까다로운 작업입니다.
1. 데이터베이스의 ACID 성질을 준수해야 하는 경우
2. 소프트웨어에 사용되는 데이터가 구조적이고 일관적인 경우
1. 데이터의 구조가 거의 또는 전혀 없는 대용량의 데이터를 저장하는 경우
2. 클라우드 컴퓨팅 및 저장공간을 최대한 활용하는 경우
3. 빠르게 서비스를 구축하는 과정에서 데이터 구조를 자주 업데이트 하는 경우