NoSQL DB 설계 방법

김민범·2025년 3월 3일

DB

목록 보기

9/12

NoSQL 데이터베이스는 관계형 데이터베이스(RDBMS)와는 다른 방식으로 데이터를 저장하고 관리하는 시스템이다. 전통적인 RDBMS는 정규화(Normalization)를 통해 데이터 무결성과 일관성을 유지하지만, NoSQL은 확장성(Scalability)과 성능(Performance)을 우선으로 설계된다. 따라서 NoSQL DB 설계 시 관계형 DB와는 다른 접근 방식이 필요하다.

NoSQL 데이터베이스는 크게 키-값(Key-Value), 문서(Document), 컬럼(Column-Family), 그래프(Graph) 네 가지 유형으로 나뉩니다. 각 유형별 특성과 설계 방법을 알아보고, 데이터 모델링 과정과 일반적인 설계 원칙을 설명한다.

1. NoSQL 설계 원칙

NoSQL 데이터 모델링은 애플리케이션 중심으로 설계되며, 다음과 같은 원칙을 따른다.

1) 데이터 접근 패턴을 먼저 정의한다.

관계형 데이터베이스에서는 데이터 정규화를 통해 중복을 최소화하는 것이 일반적이다.
NoSQL에서는 데이터가 어떻게 조회될 것인지가 가장 중요한 요소이다.
미리 예상할 수 있는 쿼리 패턴(읽기/쓰기 방식)을 정의한 후, 그에 맞는 데이터 모델을 설계한다.

2) 데이터 정규화보다는 중복을 허용한다.

RDBMS에서는 정규화를 통해 데이터 중복을 최소화하는 것이 일반적이다.
NoSQL에서는 데이터 중복을 허용하여 빠른 조회 성능을 보장한다.
한 개의 문서(Document)나 레코드 안에 관련 데이터를 포함시키는 방식이 일반적이다.

3) 관계(Relationship)를 최소화한다.

RDBMS에서는 JOIN 연산을 통해 여러 테이블 간의 관계를 설정한다.
NoSQL에서는 JOIN이 성능 저하의 원인이 되므로 데이터를 하나의 단위(문서, 컬럼 등)로 저장한다.
관계형 데이터 모델처럼 정규화된 설계는 NoSQL에 적합하지 않다.

4) 스키마리스(Schema-less) 구조를 활용한다.

RDBMS에서는 스키마(테이블 구조)가 정해져 있어, 변경이 어렵다.
NoSQL은 스키마리스(Schema-less) 또는 유연한 스키마(Flexible Schema)를 지원한다.
즉, 같은 컬렉션(문서형 DB)이나 테이블(컬럼형 DB)에서도 각각 다른 구조의 데이터를 저장할 수 있다.

5) 확장성을 고려한 데이터 분산(Sharding)을 설계한다.

NoSQL은 수평적 확장(Scale-Out)이 용이한 구조로 설계된다.
데이터 저장 시 Sharding(샤딩)을 통해 여러 서버에 데이터를 분산 저장할 수 있다.
데이터를 분산 저장할 때 적절한 샤딩 키(Shard Key)를 선정하는 것이 중요하다.

2. NoSQL 유형별 설계 방법

1) 키-값(Key-Value) 스토어 설계

대표적인 NoSQL DB: Redis, DynamoDB, Riak
특징:
- 데이터를 Key-Value 쌍(Key-Value Pair)으로 저장
- 고속 읽기/쓰기 성능을 제공
- 단순한 조회 및 캐싱(Cache) 용도로 적합
설계 방법:
- 키(Key)를 고유 식별자(Unique Identifier)로 사용
- Value에는 JSON, String, Binary 등 다양한 데이터를 저장 가능
- 예제:

{
  "user:1001": "{ \"name\": \"John Doe\", \"email\": \"john@example.com\", \"age\": 30 }",
  "user:1002": "{ \"name\": \"Alice Smith\", \"email\": \"alice@example.com\", \"age\": 25 }"
}

사용 사례:
- 세션 관리(Session Store)
- 캐싱 시스템(Redis Cache)
- 구매 기록 저장 (Amazon DynamoDB)

2) 문서(Document) 데이터베이스 설계

대표적인 NoSQL DB: MongoDB, CouchDB, Firebase Firestore
특징:
- 데이터를 JSON(BSON) 문서 형식으로 저장
- 필드의 유연성 (각 문서마다 다른 구조 허용)
- 쿼리와 인덱싱 지원
설계 방법:
- 관련 데이터를 하나의 문서에 포함 (데이터 중복 허용)
- 스키마 변경이 자유로움
- 예제:

{
  "_id": "1001",
  "name": "John Doe",
  "email": "john@example.com",
  "orders": [
    { "order_id": "O123", "amount": 150.0, "date": "2024-03-01" },
    { "order_id": "O124", "amount": 200.0, "date": "2024-03-05" }
  ]
}

사용 사례:
- 사용자 프로필(User Profile) 저장
- 로그 데이터(Log Data) 저장
- IoT 데이터 처리

3) 컬럼(Column-Family) 데이터베이스 설계

대표적인 NoSQL DB: Apache Cassandra, HBase, ScyllaDB
특징:
- 행(Row)과 컬럼(Column)으로 구성되지만, RDBMS와 다름
- 한 행에 있는 컬럼 개수가 각 행마다 다를 수 있음
- 대용량 데이터 저장 및 빠른 검색 속도 제공
설계 방법:
- 자주 조회되는 컬럼끼리 하나의 패밀리(Column Family)로 묶음
- 컬럼 기반 인덱싱 활용
- 예제:

+------------------------+---------------------------------+
| UserID                | Orders                          |
+------------------------+---------------------------------+
| 1001                  | {O123: $150, O124: $200}        |
| 1002                  | {O125: $300}                    |
+------------------------+---------------------------------+

사용 사례:
- 로그 데이터 저장 (Facebook, Twitter)
- 분산 데이터 처리 (Apache Hadoop, Big Data Analytics)

4) 그래프(Graph) 데이터베이스 설계

대표적인 NoSQL DB: Neo4j, ArangoDB, Amazon Neptune
특징:
- 노드(Node)와 관계(Edge)를 이용하여 연결된 데이터를 저장
- 관계형 데이터 모델보다 네트워크 구조 분석에 유리
설계 방법:
- 노드(Node): 데이터의 개별 엔티티
- 엣지(Edge): 노드 간의 관계
- 예제:

(User)-[:FRIEND_WITH]->(User)
(User)-[:PURCHASED]->(Product)

사용 사례:
- SNS 친구 추천 시스템 (Facebook, LinkedIn)
- 추천 시스템 (Netflix, Amazon)
- 네트워크 보안 및 이상 탐지

3. 결론

NoSQL 데이터베이스 설계는 데이터 접근 방식과 확장성을 최우선으로 고려해야 한다.
관계형 DB와 다르게 정규화보다는 중복을 허용하여 조회 성능을 최적화한다.
데이터 유형 및 요구 사항에 따라 문서형, 키-값, 컬럼형, 그래프형 DB를 선택해야 한다.

NoSQL 데이터베이스는 단순히 RDBMS를 대체하는 것이 아니라, 각각의 요구 사항에 맞게 최적화된 모델을 설계하는 것이 핵심이다.

김민범

이전 포스트

[SQL] 쿼리 개선하기

다음 포스트