[DB] RDB와 NoSQL

최동혁·2023년 1월 12일
0

데이터베이스

목록 보기
5/18

Key-value storage system ( NoSQL )

기존의 관계형 database의 경우에는 단일 기업의 데이터를 다루는데 최적화 되어 있다.
하지만 최신 데이터들은 꼭 관계형으로 처리될 필요가 없는 경우도 많고, 다뤄야 하는 데이터의 양도 훨씬 커졌다.
즉 Big data라고 일컬어 지는 많은 양의 데이터를를 처리하기 위한 방법으로 다양한 해결책이 나왔는데, 그 중 하나의 방법이 Key-value storage system 이다.

Key-value stores는 NoSQL system이라고도 불립니다. 그 이유는 SQL을 보통 지원하지 않고 transaction을 지원하지 않는 등 SQL을 사용하는 기존의 RDB와의 차이점 때문입니다.

MongoDB

NoSQL의 종류는 Bigtable, DynamoDB, Cassandra, MongoDB등이 있다.
그 중 MongoBD의 예시를 보면서 NoSQL이 어떻게 작동하는지 간단하게 살펴보자.

db.createCollection("student")

db.student.insert({"id": 2022394, "name": "Nossi", "class": ["Math", "Eng"]})
db.student.insert({"id": 2021921, "name": "Bob", "class": ["Eng"]})

db.student.find() // Fetch all students in JSON format
db.student.findOne({"id": 2022394}) // Find one matching student

db.student.remove({"name": "Nossi"}) // Delete matching students
db.student.drop() // Drops the entire collection

RDB vs NoSQL

RDB (SQL)NoSQL
데이터 저장 모델tablejson document / key-value / 그래프 등
개발 목적데이터 중복 감소애자일 / 확장가능성 / 유연성
예시Oracle, MySQL, PostgreSQL 등MongoDB, DynamoDB 등
Schema엄격한 데이터 구조유연한 데이터 구조
⭐장점⭐- 명확한 데이터구조 보장
- 데이터 중복 없이 한 번만 저장 (무결성)
- 데이터 중복이 없어서 데이터 update 용이
- 유연하고 자유로운 데이터 구조
- 새로운 필드 추가 자유로움
- 수평적 확장(scale out) 용이
⭐단점⭐- 시스템이 커지면 Join문이 많은 복잡한 query가 필요
- 수평적 확장이 까다로워 비용이 큰 수직적 확장(Scale up)이 주로 사용됨.
- 데이터 구조가 유연하지 못함
- 데이터 중복 발생 가능
- 중복 데이터가 많기 때문에 데이터 변경 시 모든 컬렉션에서 수정이 필요함
- 명확한 데이터구조 보장 X
⭐사용⭐- 데이터 구조가 변경될 여지가 없이 명확한 경우
- 데이터 update가 잦은 시스템 (중복 데이터가 없으므로 변경에 유리)
- 정확한 데이터 구조가 정해지지 않은 경우
- Update가 자주 이루어지지 않는 경우 (조회가 많은 경우)
- 데이터 양이 매우 많은 경우 (scale out 가능)

수직적 확장Scale-up vs 수평적 확장 Scale-out

DB와 비교하여 NoSQL의 특징은 ACID, Transaction을 지원하지 않는다는 것이다.
RDB는 ACID와 Transaction을 보장하기 위해 수평적 확장이 쉽지가 않다.
또한 RDB 같은 경우에는 multiple server로 수평적 확장을 하게 되면 join을 하기 위해 굉장히 복잡한 과정이 필요하다.

RDB도 수평적 확장이 가능하지만 NoSQL에 비해 훨씬 복잡하다.
RDB를 수평적 확장하려면 샤딩(sharding)(데이터가 수평적으로 분할되고 기기의 모음 전반에 걸쳐 분산되는 경우)이 필요하다.
ACID 준수를 유지하면서 RDB를 샤딩하는 것은 매우 까다로운 작업이다.

면접 질문

  1. NoSQL은 언제 사용하면 좋을까요?

    NoSQL은 정확한 데이터 구조가 정해지지 않은 경우, 데이터 update가 자주 이루어지지 않고 조회가 많은 경우, 또 scale out이 가능하므로 데이터 양이 매우 많은 경우에 사용하면 좋습니다.

  2. RDB는 언제 사용하면 좋을까요?

    RDB는 데이터 구조가 명확하여 변경될 여지가 없는 경우, 또 데이터 중복이 없으므로 데이터 update가 잦은 시스템에서 사용하면 좋습니다.

  3. RDB와 NoSQL를 비교 설명해 주세요.

    관계형 데이터베이스(RDB)는 사전에 엄격하게 정의된 DB schema를 요구하는 table 기반 데이터 구조를 갖습니다.
    NoSQL(비관계형 데이터베이스)은 table 형식이 아닌 비정형 데이터를 저장할 수 있도록 지원합니다.
    RDB는 엄격한 schema로 인해 데이터 중복이 없기 때문에 데이터 update가 많을 때 유리합니다.
    NoSQL의 경우 데이터 중복으로 인해 데이터 update 시 모든 컬렉션에서 수정이 필요하기 때문에 update가 적고 조회가 많을 때 유리합니다.

profile
항상 성장하는 개발자 최동혁입니다.

0개의 댓글