[DB] NoSQL vs SQL

박연주·2022년 9월 14일
0

DB / SQL

목록 보기
1/4

Database, DBMS, SQL

Databse

  • 일반적으로 컴퓨터 시스템에 전자 방식으로 저장된 구조화된 정보 또는 데이터의 체계적인 집합을 의미

DBMS(DataBase Management System)

  • 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 생성해 주고 데이터베이스를 관리해 주는 소프트웨어

SQL(Strucured Query Language)

  • 관계형 데이터베이스 관리 시스템의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어
  • 관계형 데이터베이스 관리 시스템에서 자료의 검색과 관리, 데이터베이스 스키마 생성과 수정, 데이터베이스 객체 접근 조정 관리를 위해 고안

RDBMS

RDBMS(Relational Database Management System)

  • 관계형 데이터베이스(RDB) 관리 시스템을 의미, RDB는 관계형 데이터 모델을 기초로 두고 모든 데이터를 2차원 테이블 형태로 표현하는 데이터베이스
  • 기존의 RDBMS에서의 저장 방식은 SQL에 의해 저장되고 있으며 정해진 스키마에 따라 데이터를 저장해야 함
  • 구성된 테이블이 다른 테이블들과 관계를 맺고 모여있는 집합체로 이해 가능
  • 관계를 나타내기 위해 외래 키(foreign key) 사용
  • 외래 키를 이용한 테이블 간 Join이 가능

장점

  • 보안이 강력하다.
    파일 기반 저장방법은 운영체제만 해킹당해도 파일에 저장된 데이터들이 해킹될 수 있으나, database는 운영체제가 해킹당하더라도 프로그램 자체의 추가적인 보안을 가지고 있기 때문에, 파일 기반 저장방법보다 보안이 강력하다.

  • 사용자마다 권한을 부여할 수 있다.
    데이터베이스를 이용하는 사용자에게 서버에 존재하는 데이터베이스, 테이블에 대하여 C,R,U,D 권한을 각각 부여할 수 있다.
    root ID는 데이터베이스와 관련한 모든 기능 권한을 가지고 있다. 일반적으로 DB와 관련한 중요한 작업만 root ID를 이용하고, 일상적인 작업은 다른 ID에게 권한을 부여해서 사용하는 것이 권장된다고 한다.

NoSQL

NoSQL(Not Only SQL)

  • RDB 형태의 관계형 데이터베이스가 아닌 다른 형태의 데이터 저장 기술을 의미
  • RDBMS와는 달리 테이블 간 관계를 정의x.
    데이터 테이블은 그냥 하나의 테이블이며 테이블 간의 관계를 정의하지 않아 일반적으로 테이블 간 Join도 불가능
  • 점점 빅데이터의 등장으로 인해 데이터와 트래픽이 기하급수적으로 증가함에 따라 데이터 일관성은 포기하되 비용을 고려하여 여러 대의 데이터에 분산하여 저장하는 Scale-Out을 목표로 등장(RDBMS는 Scale-up을 위해 많은 비용이 듬)

  • RDBMS 스키마에 맞추어 데이터를 관리해야 된다는 한계를 극복하고 수평적 확장성(Scale-out)을 쉽게 할 수 있다는 장점을 가지고 있음

  • SQL은 정해진 스키마를 따르지 않으면 데이터 추가가 불가능하지만 NoSQL에서는 다른 구조의 데이터를 같은 컬렉션에 추가가 가능

  • 문서(documents)는 Json과 비슷한 형태로 가지고 있음. 관계형 데이터베이스처럼 여러 테이블에 나누어담지 않고, 관련 데이터를 동일한 '컬렉션'에 넣음(레코드를 문서(documents)라고 함)

  • 예) SQL에서 진행한 Orders, Users, Products 테이블로 나눈 것을 NoSQL에서는 Orders에 한꺼번에 포함해서 저장
    따라서 여러 테이블에 조인할 필요없이 이미 필요한 모든 것을 갖춘 문서를 작성하는 것이 NoSQL이다. (NoSQL에는 조인이라는 개념이 존재하지 않음)

조인하고 싶을 때 NoSQL은 어떻게 할까?

  • 컬렉션을 통해 데이터를 복제하여 각 컬렉션 일부분에 속하는 데이터를 정확하게 산출
  • 하지만 이러면 데이터가 중복되어 서로 영향을 줄 위험이 있다. 따라서 조인을 잘 사용하지 않고 자주 변경되지 않는 데이터일 때 NoSQL을 쓰면 상당히 효율적이다.

SQL (관계형 데이터베이스)

  • Structured Query Language, 즉 '구조화 된 쿼리 언어'의 약자

  • 즉 데이터베이스 자체를 나타내는 것이 아니라 특정 유형의 데이터베이스와 상호 작용하는 데에 사용하는 쿼리 언어를 뜻함
    (하지만 보통 SQL을 쿼리 언어라기 보다는 '관계형 데이터베이스' 라는 의미로 사용)

  • SQL을 사용하면 관계형 데이터베이스 관리 시스템(RDBMS)에서 데이터를 저장, 수정, 삭제, 검색 가능

    관계형 데이터베이스의 주요 특징 두가지

    1. 데이터는 정해진, 엄격한 데이터 스키마(=structure)를 따라 데이터베이스 테이블에 저장됩니다.
    2. 데이터는 관계를 통해서 연결된 여러개의 테이블에 분산됩니다.

    정해진, 엄격한 스키마란?

    • 데이터는 테이블(table)에 레코드(record)로 저장됩니다.
    • 각 테이블에는 명확하게 정의된 구조(structure)가 있습니다.
    • 여기서 '구조'란 어떤 데이터가 테이블에 들어가고 어떤 데이터가 그렇지 않을지를 정의하는 필드(field) 집합을 가르킵니다.
    • 관계형 데이터베이스에서 스키마를 준수하지 않는 레코드는 추가할 수 없습니다.


NoSQL (비관계형 데이터베이스)

  • 스키마 없고! 관계도 없고!

  • NoSQL은 기본적으로 SQL과 반대되는 접근방식을 따르기 때문에 지어진 이름입니다. (Not Only SQL)

    비관계형 데이터베이스의 주요 특징 두가지

    1. 스키마가 없습니다.
    2. 관계가 없습니다.

    NoSQL 세계관에서 레코드 = 문서(documents)

    • 단순히 이름만 다른 것이 아니라, 핵심적인 차이점이 있습니다.

      -> SQL 세상에서는 정해진 스키마를 따르지 않는다면 데이터를 추가할 수 없지만, NoSQL에서는 다른 구조의 데이터를 같은 컬렉션(=SQL에서의 테이블)에 추가할 수 있다는 점입니다!

SQL vs NoSQL

SQL의 장점

  • 명확하게 정의 된 스키마 = 데이터 무결성 보장
  • 관계는 각 데이터를 중복없이 한번만 저장됨

NoSQL의 장점

  • 스키마가 없기 때문에, 훨씬 더 유연함.
    즉, 언제든지 저장된 데이터를 조정하고 새로운 '필드'를 추가 할 수 있음
  • 데이터는 애플리케이션이 필요로 하는 형식으로 저장됨.
    = 데이터를 읽어오는 속도가 빨라짐
  • 수직 및 수평 확장이 가능하므로 데이터베이스가 애플리케이션에서 발생시키는 모든 읽기 / 쓰기 요청을 처리 할 수 있음

SQL의 단점

  • 데이터 스키마는 사전에 계획되어야 함 = 상대적으로 덜 유연함.
    (나중에 수정하기가 번거롭고 불가능 할 수도 있음)
  • 관계를 맺고 있기 때문에, Join문이 많고 매우 복잡한 쿼리가 만들어 질 수 있음
  • 수평적 확장이 어렵고, 대체로 수직적 확장만 가능함
    즉 어떤 시점에서 처리 할 수 있는 처리량과 관련하여 성장 한계에 직면함

NoSQL의 단점

  • 유연성 때문에 데이터 구조 결정을 하지 못하고 미루게 될 수 있음

  • 데이터 중복은 여러 컬렉션과 문서가 여러 레코드가 변경된 경우 업데이트 해야 함

  • 데이터가 여러 컬렉션에 중복되어 있어서 수정을 해야하는 경우 모든 컬렉션에서 수행해야 함
    (SQL은 중복된 데이터가 없기 때문에 한번만 수행하면 됨)

그렇다면 각각 어떨 때 써줘야 맞는 걸까?

SQL은 언제 사용할까?

  • 관계를 맺고 있는 데이터가 자주 변경(수정)되는 애플리케이션일 경우
    (NoSQL에서라면 여러 컬렉션을 모두 수정해줘야만 합니다.)
  • 변경될 여지가 없고, 명확한 스키마가 사용자와 데이터에게 중요한 경우

NoSQL은 언제 사용할까?

  • 정확한 데이터 구조를 알 수 없거나 변경 / 확장 될 수 있는 경우
  • 읽기(read)처리를 자주하지만, 데이터를 자주 변경(update)하지 않는 경우
    (즉, 한번의 변경으로 수십 개의 문서를 업데이트 할 필요가 없는 경우)
  • 데이터베이스를 수평으로 확장해야 하는 경우 ( 즉, 막대한 양의 데이터를 다뤄야 하는 경우)

<용어정리>

스키마

  • 데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술한 메타데이터의 집합
  • 데이터베이스를 구성하는 데이터 개체(Entity), 속성(Attribute), 관계(Relationship) 및 데이터 조작 시 데이터 값들이 갖는 제약 조건 등에 관해 전반적으로 정의



Reference

https://coding-factory.tistory.com/216 - 스키마
https://velog.io/@kr4460/RDBMS%EC%9D%98-%EA%B5%AC%EC%84%B1%EC%9A%94%EC%86%8C%EC%99%80-%EC%9E%A5%EC%A0%90 - RDBMS 구조와 장점

profile
하루에 한 개념씩

0개의 댓글