벡터 DB vs RDBMS vs NoSQL

이세준·2025년 8월 4일
0

벡터 DB vs RDBMS vs NoSQL

정확성의 시대를 넘어, 유사성의 시대를 위한 데이터베이스의 진화


1. 각 데이터베이스의 역할 요약

유형주요 목적데이터 예시핵심 쿼리 방식
RDBMS정형 데이터 저장 및 관계 질의숫자, 문자열, 날짜 등WHERE, JOIN, GROUP BY 등 SQL
NoSQL유연한 구조, 대규모 분산 처리JSON, 문서, 키-값, 그래프 등키 기반 조회, 문서 검색
벡터 DB벡터 기반 유사도 검색임베딩 벡터 (텍스트, 이미지 등)k-NN 검색 (유사한 벡터 찾기)

2. 쿼리 방식의 본질적 차이

  • RDBMS는 “정확히 일치하는” 값을 찾는 데 적합하다.
    예: WHERE id = 5 또는 WHERE age > 30 AND city = '서울'

  • NoSQL은 구조가 유동적인 데이터를 빠르게 저장하고, 간단한 키 조회나 문서 기반 쿼리에 강하다.
    예: MongoDB에서 { "userId": "abc123" } 같은 문서 검색

  • 벡터 DB는 “비슷한 것을 찾아줘”에 특화되어 있다.
    예: “이 문장과 의미가 유사한 문장 5개 찾아줘”
    벡터 DB는 정확히 일치하는 값을 찾지 않고, 수학적으로 가장 가까운 벡터들을 찾는다. 이를 위해 K-최근접 이웃(KNN) 알고리즘이 핵심 역할을 한다.


3. 데이터 구조와 저장 방식 비교

항목RDBMSNoSQL벡터 DB
저장 데이터행(row), 열(column) 구조키-값 또는 문서 형태ID + 고차원 벡터
예시 데이터("홍길동", 30, "서울"){ name: "홍길동", age: 30 }("doc1", [0.12, 0.87, 0.33, ...])
데이터 타입숫자, 문자열, 날짜 등문자열, 배열, 객체 등실수(float)로 구성된 N차원 벡터

벡터 DB는 벡터의 고차원 수치 배열을 다루기 때문에, 정렬이나 필터링보다 거리 계산유사도 기반 검색이 핵심이다.


4. 인덱싱 방식의 차이

  • RDBMS: B-tree, Hash index 등의 정렬된 인덱스 구조를 사용해 빠르게 값 검색
  • NoSQL: Key 기반 해시 인덱스 또는 문서 내 특정 필드 인덱스
  • 벡터 DB: 검색 효율성을 위해 특수한 인덱싱 알고리즘 사용

벡터 DB에서 자주 쓰이는 인덱싱 방식

인덱스 기법특징
HNSW (Hierarchical Navigable Small World)그래프 기반, 정확도와 속도 균형 우수
IVF (Inverted File Index)벡터를 클러스터링 후 후보만 탐색
LSH (Locality Sensitive Hashing)유사한 벡터끼리 같은 해시로 매핑하여 빠르게 검색

기존 DB에서는 이런 복잡한 수치 기반 인덱싱이 필요하지 않지만, 벡터 DB에서는 필수적인 구성 요소다.


5. 주요 질의 목적과 대상의 차이

항목RDBMS/NoSQL벡터 DB
질의 목적값 조회, 조건 검색, 집계유사 벡터 검색
질의 대상속성(attribute)벡터 공간의 거리
결과 기준값의 일치 여부유사도의 크기 순 (Top-K)
쿼리 언어SQL / 문서 기반 쿼리API or 벡터 쿼리 DSL (예: search(vector, k))

6. 사용 시나리오로 이해하는 차이

상황: 사용자가 “바다 풍경 사진”을 검색하고 싶다

  • RDBMS:
    검색어 = “바다” → 태그 컬럼에서 문자열 검색
    → 정확히 "바다"라는 태그가 붙은 사진만 찾을 수 있다

  • NoSQL:
    문서에서 "tags": ["바다", "풍경"] 조건으로 검색
    → 태그가 잘 정리되어 있어야 하고, 검색어에 맞는 태그가 등록되어 있어야 함

  • 벡터 DB:
    “바다 풍경”이라는 텍스트를 임베딩 → 해당 벡터와 유사한 이미지의 벡터들을 KNN으로 검색
    → 태그가 없어도, 실제로 유사한 이미지들이 검색됨


7. 요약 비교

항목RDBMSNoSQL벡터 DB
정형성정형 데이터 전용반정형, 유연한 구조비정형 데이터의 벡터 표현
쿼리 기준정확한 값키 or 필드 조건유사도 기반 (거리/각도)
검색 대상속성 값문서 or 키고차원 벡터
인덱스B-Tree, Hash해시, 필드 인덱스HNSW, IVF, LSH 등
쓰임새전통적 업무 시스템실시간 웹, 로그 처리AI 검색, 추천, 의미 기반 검색

8. 마무리

벡터 DB는 기존의 데이터베이스처럼 “값을 정확히 조회”하는 방식이 아니라,
유사한 의미, 비슷한 특성을 기준으로 정보를 찾아주는 완전히 다른 검색 패러다임을 제공한다.

RDB나 NoSQL이 정형·반정형 데이터를 빠르게 저장하고 조작하는 데 최적화되어 있다면,
벡터 DB는 의미 중심의 검색, 즉 사람의 직관과 유사한 방식으로 정보를 찾는 데 특화된 도구다.

앞으로 LLM 기반 RAG 시스템, 개인화 추천, 유사 이미지 검색 등 고도화된 AI 응용이 늘어날수록 벡터 DB의 활용도는 더 커질 것이다.
즉, 벡터 DB는 단지 새로운 종류의 데이터베이스가 아니라, 새로운 질의 방식에 대응하는 진화된 인프라라고 할 수 있다.


profile
기술정리

0개의 댓글