[DB] RDB와 NoSQL의 특징

주운·2024년 3월 14일

RDB, NoSQL이란?

RDB(관계형 데이터베이스)

관계형 데이터베이스는 데이터를 테이블로 구성해 관리하는 데이터베이스 형태다.

테이블을 열과 행으로 구성되며 열은 데이터의 속성을 정의하고, 행은 실제 데이터 레코드를 나타낸다.

테이블 간의 관계를 통해 데이터 간의 연결을 표현하고 효율적으로 관리한다.

ACID 속성을 보장하여 데이터의 무결성을 보장한다.

  • 원자성(Auomicity)
  • 일관성(Consistency)
  • 격리성(Isolation)
  • 지속성(Durability)

SQL 표준화된 쿼리 언어를 사용해 데이터를 업데이트&관리한다.

NoSQL(Not Only SQL)

NoSQL은 관계형 데이터베이스의 구조적 한계를 극복하기 위해 개발된 데이터베이스 시스템이다.

NoSQL이라는 이름에서 알 수 있듯이, SQL이 아닌 다른 방식으로도 데이터를 저장하고 조회할 수 있다.

구조화된 스키마를 요구하지 않고, 데이터를 유연하게 저장하고 관리할 수 있다는 것이 특징이다. 키-값 저장소, 문서 기반, 열 기반, 그래프 데이터베이스 등 다양한 방식으로 데이터를 구성할 수 있다.

문서 기반 예시

users = [
    {
        "user_id": 1,
        "name": "Alice",
        "email": "alice@example.com",
        "favorites": [
            {
                "title": "The Catcher in the Rye",
                "author": "J.D. Salinger"
            },
            {
                "title": "1984",
                "author": "George Orwell"
            }
        ]
    },
    {
        "user_id": 2,
        "name": "Bob",
        "email": "bob@example.com",
        "favorites": [
            {
                "title": "To Kill a Mockingbird",
                "author": "Harper Lee"
            }
        ]
    }
]

비교

RDB와 NoSQL의 차이는 스키마제약 조건(기본 키, 외래 키, 유니크 등) 등 데이터 구성 방식에서 비롯된다.

안정성

안정성의 측면에서, RDB는 ACID 보장, 트랜잭션 관리, 외래 키 설정 등을 통해 데이터의 일관성을 보장하고 문제시 트랜잭션 단위의 롤백을 지원한다.

ACID 속성은 데이터베이스 내에서 트랜잭션이 안전하게 수행된다는 것을 보장한다.

  • 원자성(Auomicity)
    • 하나의 트랜잭션은 하나의 원자처럼 동작한다.(일부만 수행되지 않는다.)
  • 일관성(Consistency)
    • 트랜잭션 후에도 일관성이 보장되어야 한다.
  • 격리성(Isolation)
    • 트랜잭션 중 다른 트랜잭션에 영향을 주거나, 받지 않아야 한다.
  • 지속성(Durability)
    • 트랜잭션 완료 후 사용자가 완료 통지를 받은 시점에서 조작은 영구적으로 저장된다.

확장성

NoSQL
NoSQL은 확장성을 고려하여 설계된 데이터베이스 시스템이다. 성능 향상, 저장 용량 증가를 위한 서버 추가가 간단하다. 대규모 분산 시스템에서의 사용에 유리하다.

NoSQL은 고정된 스키마가 없기 때문에 새로운 노드를 추가하더라도 데이터 모델을 수정하지 않아도 되며, 확장 과정이 단순화된다.

NoSQL은 데이터를 샤딩 또는 파티셔닝 하는 방법으로 수평적으로 확장한다. 각 샤드/파티션은 독립적으로 운영되며 여러 서버에 걸쳐 데이터를 분산시켜 시스템의 부하를 분산시키고 확장성을 높인다.


RDB
RDB는 데이터 간 관계를 중심으로 설계되었기 때문에 데이터가 여러 서버에 분산 저장될 때 테이블 간의 조인 연산이나 복잡한 트랜잭션 처리가 어렵다.

고정된 스키마 구조를 가지기 떄문에 데이터 구조 변경 시에 분산 환경에서 데이터 일관성 유지가 어렵다.

또한 데이터 무결성, ACID 트랜잭션 특성 여러 서버에 걸쳐 유지하는 것은 추가 오버헤드가 발생한다.

RDB를 수평 확장하기 위해 리플리케이션기법을 사용하기도 한다.

리플리케이션은 마스터-슬레이브 구조로, 하나의 마스터 서버에서 쓰기 연산을 처리하고, 여러 슬레이브 서버에서 읽기 연산을 처리한다. 쓰기 후 데이터 전파 중 일관성이 보장되지 않을 수 있다. 이는 응용프로그램을 통한 관리가 필요하다.

속도

NoSQL이 RDB보다 처리 속도가 빠르다.

복잡한 연산, 조인 등의 경우에는 RDB가 유리할 수 있다.

단순한 쿼리
NoSQL 데이터베이스는 대부분 단순한 쿼리 모델을 사용한다. 복잡한 조인을 사용하지 않기에 단순 데이터 검색, 수정을 빠르게 수행할 수 있다.

no 스키마
고정된 스키마가 없기 때문에 데이터 구조 변경을 빠르고 간단하게 처리한다. 애플리케이션 변화로 인한 데이터 구조 변경 시 오버헤드가 일어나지 않는다.

특화된 데이터 모델
NoSQL 데이터베이스는 키-값 저장소, 문서 기반, 컬럼 기반, 그래프 등 다양한 데이터 유형을 제공하여, 용도에 따라 데이터 접근과 처리를 최적화할 수 있다.

ex: 열 기반 데이터베이스를 이용해 분석 쿼리를 수행할 때 필요한 데이터만 빠르게 읽음

상황에 맞는 DB 선택

RDBMS

정확한 데이터 모델링, 복잡한 트랜잭션 처리, 엄격한 데이터 일관성 요구 사항이 있는 경우에 적합

  • 금융 시스템

    • 은행, 주식 거래, 보험 등 금융 관련 시스템은 거래의 정확성과 일관성이 중요하다.
  • 기업 관리 시스템

    • 기업 내 다양한 부서, 직원 정보 등 데이터 간의 복잡한 관계를 효과적으로 처리해야 한다.
  • 온라인 쇼핑

    • 상품 정보, 고객 데이터, 주문 내역 등을 관리해야 하는 쇼핑 플랫폼은 데이터의 일관성과 무결성이 중요하다.

NoSQL

빠른 확장성, 유연한 데이터 모델, 대량의 비구조화된 데이터 처리가 필요한 경우 적합

  • SNS

    • 대용량의 비구조화된 데이터를 다루고, 데이터 스키마가 자주 변경될 수 있다.
  • 빅 데이터 분석 및 실시간 처리

    • 빅 데이터 분석, 실시간 로그 처리, 스트리밍 데이터 분석 등 대량의 데이터를 빠르게 처리하고 분석해야 하는 경우 NoSQL이 적합하다.
  • 사물인터넷(IoT)

    • 다양한 종류의 센서 데이터를 수집하고 처리해야 하는 IoT 시스템은 유연한 데이터 모델과 확장성을 요구한다.

0개의 댓글