[데이터베이스] NoSQL / MongoDB 개념 학습

hosik kim·2022년 2월 6일
0
post-thumbnail

📌 NoSQL(Not Only SQL)


  • NoSQL은 매우 넓은 범위에서 사용하는 용어로, 관계형 테이블의 레거시한 방법을 사용하지 않는 데이터 저장소를 말한다.
  • NoSQL 데이터베이스에서는 데이터를 행과 열이 아닌, 체계적인 방식으로 저장한다.

🔸 Usage

NoSQL 데이터베이스는 관계를 중점을 둔 SQL 데이터베이스보다 자유로운 형태로 데이터를 저장할 수 있으므로 필요에 따라서
새로운 데이터 유형을 추가할 수 있다. 소프트웨어 개발에 정형화되지 않은 많은 양의 데이터가 필요한 경우, NoSQL이 효율적일 수 있다.

NoSQL 데이터베이스는 데이터베이스를 클라우드 기반으로 쉽게 분리 할 수 있도록 지원하여, 저장 공간을 효율적으로 사용한다.
시스템이 커지면서 DB를 증성해야 하는 시점이 오면, SQL 데이터베이스에서는 수직적 확장의 형태로 DB를 증설한다.
수직적으로 확장된 데이터베이스는 관리가 어려워질 수 있는데에 반해, NoSQL은 수평적 확장의 형태로 증설하므로, 이론상 무한대로 서버를 계속 분산시켜 DB를 증설할 수 있다.

NoSQL 데이터베이스의 경우 스키마를 미리 준비할 필요가 없어서, 개발을 빠르게 해야하는 경우에 매우 적합하다.
시장에 빠르게 프로토타입을 출시해야 하는 경우나, 소프트웨어 버전별로 많은 다운타임(데이터베이스의 서버를 오프라인으로 전환하여 작업하는 시간)
없이 데이터 구조를 가주 업데이트 해야하는 경우에는 일일이 스키마를 수정해주어야 하는 관계형 데이터베이스 보다 NoSQL 기반의 비관계형
데이터베이스가 더 효율적이다.

📌 MongoDB


MongoDB는 대표적인 NoSQL 도큐먼트 데이터베이스이며, 도큐먼트 데이터베이스는 데이터를 테이블이 아닌, 문서처럼 저장하는 데이터베이스를
의미한다.

일반적으로 도큐먼트 데이터베이스에서는 JSON 유사 형식으로 데이터를 문서화한다. 각각의 도큐먼트는 데이터를 필드-값 쌍(Field - Value pair)의 형태로
가지고 있고, 컬렉션이라고 하는 그룹으로 묶어서 관리한다.

MongoDB는 데이터를 도큐먼트의 형태로 저장한다. 도큐먼트는 컬렉션에 저장되며, 이것이 MongoDB가 NoSQL 도큐먼트
데이터베이스로 분류되는 이유이다.

{ 
  <field>:<value>,
  <field>:<value>,
    "name":"kimcoding",
    "title":"Chapter Lead",
    "age":30
}

위 예제에서 name 이란 필드의 값은 kimcoding 이다. 이러한 도큐먼트의 모음을 컬렉션이라고 한다. 그리고
데이터베이스는 여러 개의 컬렉션으로 구성된다.

🔸 Atlas Cloud

MongoDB에서는 아틀라스(Atlas)로 클라우드에 데이터베이스를 설정한다.
아틀라스는 GUI와 CLI로 데이터를 시각화, 분석, 내보내기, 그리고 빌드하는 데에 사용할 수 있다.
아틀라스 사용자는 클러스터를 배포 할 수 있으며, 클러스터는 그룹화된 서버에 데이터를 저장한다.

클러스터는 인스턴스들의 모임이다. 클러스터는 하나의 시스템처럼 작동한다.

하나의 클러스터에서 각각의 인스턴스는 동일한 복제본을 갖고있으며, 이 모음을 레플리카 세트라고 부른다.
클러스터를 이용하여 배포하는 경우, 자동으로 레플리카 세트를 생성한다.

그룹화된 서버는 레플리카 세트로 구성되어 있으며, 레플리카 세트는 동일한 데이터를 저장하는 몇개의 연결된
MongoDB 인스턴스 모음이다.

레플리카 세트는 동일한 데이터를 저장하는데, 이는 데이터의 사본을 저장한다는 의미이다. 즉, 인스턴스 중
하나에 문제가 발생하더라도, 데이터는 그대로 유지되며, 나머지 레플리카 세트의 인스턴스에 저장된 데이터로 작업이 가능하다.

인스턴스는 특정 소프트웨어를 실행하는 로컬 또는 클라우드의 단일 머신이다. 이 경우에서 인스턴스는 클라우드에서 실행되는
MongoDB 데이터베이스이다.

도큐먼트나 컬렉션을 번경할 경우, 변경된 데이터의 중복 사본이 레플리카 세트에 저장된다.

이 설정 덕분에 레플리카 세트의 인스턴스 중 하나에 문제가 발생하더라도 데이터는 그대로 유지되며, 레플리카 세트의 애플리케이션에서
나머지 작업을 할 수 있다.
이 과정을 위해 클러스터(서버 그룹)를 배포하면, 자동으로 레플리카 세트가 구성된다.

  • 레플리카 세트

동일한 데이터를 저장하는 소수의 연결된 머신을 뜻한다. 레플리카 세트중에 하나에 문제가 발생하더라도,
데이터를 그대로 유지할 수 있다.

  • 인스턴스

로컬 또는 클라우드에서 특정 소프트웨어를 실행하는 단일 머신, MongoDB에서는 데이터베이스이다.

  • 클러스터

데이터를 저장하는 서버 그룹으로 여러 대의 컴퓨터를 네트워크를 통해 연결하여 하나의 단일 컴퓨터처럼 동작하도록 제작한 컴퓨터_를 뜻한다.

🔸 Document

도큐먼트는 객체와 같이 데이터를 필드-값 쌍(Field - Value pair)으로 저장하고 구성한다.

도큐먼트에서 필드는 데이터의 고유한 식별자이고, 값은 주어진 식별자와 관련된 데이터를 뜻한다.

  • 도큐먼트(Document)
    필드 - 값 쌍으로 저장된 데이터

  • 필드(Field)
    데이터 포인트를 위한 고유한 식별자

  • 값(Value)
    주어진 식별자와 연결된 데이터

  • 컬렉션(Collection)
    MongoDB의 도큐먼트로 구성된 저장소이다.
    일반적으로 도큐먼트 간의 공통 필드가 있다.
    데이터베이스 당 많은 컬렉션이 있고, 컬렉션 당 많은 도큐먼트가 있을 수 있다.

shell을 이용하여 도큐먼트를 조회하거나 업데이트 할 때, 도큐먼트는 JSON(Javascript Object Notation)형식으로 출력된다.

JSON 형식으로 도큐먼트를 작성하기 위해서는, 다음과 같은 조건을 만족해야한다.

{
  "_id":"12039124124",
  "date":ISODate("2022-02-06T00:00:00Z"),
  "field":"value",
  "field":"value",
    ...
}
  • {} 중괄호로 도큐먼트가 시작하고, 끝나야한다.
  • 필드와 갑이 콜론(:)으로 분리되어야 하며, 필드와 값을 포함하는 쌍은 쉼표(,)로 구분된다.
  • 문자열인 필드도 쌍따옴표("")로 감싸야한다.

이 조건중 어느 하나라도 충족되지 않는다면, 이는 유효한 도큐먼트가 아니다.


📌 JSON vs BSON


JSON 형식은 읽기 쉽고, 많은 개발자들이 사용하기 편리한 형태를 가지고 있다.
그렇기 때문에 JSON 형식은 데이터를 저장하는 좋은 방법 중 하나이다.
그러나 JSON의 형태로 데이터를 저장할 때 단점도 존재한다.

JSON은 텍스트 형식이기 때문에 읽기 쉽지만, 파싱이 느리고 메모리 사용이 비효율적이다.
그리고 JSON은 기본 데이터 타입만을 지원하기 때문에, 사용할 수 있는 데이터 타입에 제약이 있다.

이런 문제점을 해결하기 위한 방안으로 BSON(Binary JSON) 형식을 도입하였다.


[그림] BSON의 예시

BSON은 컴퓨터의 언어에 가까운 이진업에 기반을 둔 표현법이다. 따라서 JSON보다 메모리 사용이 효율적으로 빠르고, 가볍고, 유연하다.
뿐만 아니라, BSON의 사용으로 더 많은 데이터 타입을 사용할 수 있다.

MongoDB는 JSON형식으로 작성된 것은 무엇이든 데이터베이스에 추가할 수 있고, 쉽게 조회할 수 있다.
그러나 내부에서는 속도, 효율성, 유연성의 장점이 있는 BSON으로 데이터를 저장, 사용하고 있다.

  • MongoDB는 BSON로 데이터를 저장하고, JSON의 형태로 조회할 수 있다.
  • BSON은 JSON보다 파싱(parse)하는데 더 빠르고, 저장하기에 더 가볍다.
  • JSON은 BSON보다 더 적은 데이터 타입을 지원한다.

📌 Importing & Exporting


MongoDB의 데이터는 BSON의 형태로 저장이 되고, 보통 읽기 쉬운 JSON의 형태로 출력된다.
그래서 조건에 따라, 가져오거나 내보낼 때 사용 가능한 명령어가 각각 존재한다.

  • JSON 형식으로 데이터를 가져오고 내보내기 위한 명렁어

    • mongoimport
      • mongoimport --uri "<Atlas Cluster URI>" --drop=<filname>.json
    • mongoexport
      • mongoexport --uri "<Atlas Cluster URI>" --collection=<collection name> --out=<filename>.json
  • BSON 형식으로 데이터를 가져오고 내보내기 위한 명령어

    • mongorestore
      • mongorestore --uri "<Atlas Cluster URI>" --drop dump
    • mongodump
      • mongodump --uri "<Atlas Cluster URI>"
profile
안되면 될 때까지👌

0개의 댓글