[DataBase] Database란?

hukim·2020년 10월 3일
2
post-custom-banner

DataBase

  • DataBase란 데이터를 저장 및 보존하는 시스템입니다.
  • Application에서는 데이터가 메모리 상에서 존재합니다. 하지만 메모리 상에 존재하는 데이터들은 보존이 되지 않습니다. 해당 Application이 종료되면 메모리에 있던 데이터들도 없어지게 됩니다.
  • 따라서 데이터의 장기 저장 및 보존을 위해서 데이터 베이스를 이용하게 됩니다.
  • 일반적으로 DataBase에는 크게 관계형 데이터베이스 RDBMS와 'NoSQL'로 명칭되는 비관계형 데이터베이스가 있습니다.

관계형 데이터베이스(RDMBS)

  • 관계형 모델에기초를 둔 데이터베이스 시스템입니다. ex)MySQL, Postgres, Oracle DB
  • 관계형 데이터란 서로 상호관련성을 가진 형태로 표현한 데이터들을 말합니다.
    • 모든 데이터들은 2차원 테이블로 표현 됩니다.
    • 각각의 테이블은 column(컬럼)과 row(로우)로 구성됩니다.
      • 컬럼은 테이블의 각 항목을 말합니다.
      • 로우는 각 항목들의 실제 값들을 말합니다.
      • 각 로우는 저만의 고유 키인 Primary Key가 있고 이 키를 통해서 해당되는 로우를 찾거나 인용할수 있습니다.
    • 각각의 테이블들은 서로 상호관련성을 가지고 서로 연결될 수 있습니다.
      • 테이블끼리의 연결은 3가지 종류가 있습니다.
        • one to one
        • one to many
        • many to many
      • One to One
        • 테이블 A의 로우와 테이블 B의 로우가 정확히 일대일 매칭이 되는 관계입니다.
      • One to Many
        • 테이블 A의 로우가 테이블 B의 여러 로우와 연결이 되는 관계입니다.
      • Many to Many
        • 테이블 A의 여러 로우가 테이블 B의 여러 로우와 연결이 되는 관계입니다.

테이블과 테이블의 연결

  • Foregin Key(외부 키)라는 개념을 이용하여 주로 테이블을 연결합니다.
  • 위의 one to one예에서 contact info 테이블의 student id 컬럼은 Students 테이블에 걸려있는 외부 키라고 지정합니다.
  • 즉 데이터베이스에게 student id의 값은 Students 테이블의 student id 컬럼에 존재하는 값만 생성될 수 있습니다.
  • Studetns 테이블에 없는 값이 지정되면 에러가 발생합니다.

왜 테이블을 연결해야하나?

  • 하나의 테이블에 모든 정보를 다 넣으면 동일한 정보들이 불필요하게 중복되어 저장됩니다.
    • 더 많은 디스크를 사용하게 되고
    • 잘못된 데이터가 저장 될 가능성이 높아집니다.
  • 여러 테이블에 나누어서 저장한 후 필요한 테이블끼리 연결시키면 위의 2문제가 사라집니다.
    • 중복된 데이터를 저장하지 않기 때문에 디스크를 보다 효율적으로 사용하고
    • 서로 같은 데이터이지만 부분적으로 다른 데이터가 생기는 문제가 없어집니다.
    • 이러한 과정을 Normalization(정규화)라고 합니다.

Transaction(트랜잭션)

DB는 ACID를 제공함에 따라 트랜잭션 기능을 제공합니다.
트랜잭션이라는 것은 데이터베이스 내에서 일련의 작업들을 한번에 하나의 unit으로 실행하는 것입니다.

트랜잭션은 일련의 작업들이 마치 하나의 작업처럼 취급되어서 모두 다 성공하거나 아니면 모두 다 실패하는걸 이야기합니다. (Commit & Rollback)

ACID

  • Atomicity(원자성)은 트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는 능력입니다. 예를 들어, 자금이체는 성공할 수도 실패할 수도 있지만 보내는 쪽에서 돈을 빼오는 작업만을 성공하고 받는 쪽에 돈을 넣는 작업을 실패해서는 안되겠죠. 원자성은 이와같이 중간 단계까지 실행되고 실패하는 일이 없도록 하는 것입니다.
  • Consistency(일관성)은 트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 유지하는 것을 의미합니다. 무결성 제약이 모든 계좌는 잔고가 있어야 한다면 이를 위반하는 트랜잭션은 중단됩니다.
  • Isolation(독립성)은 트랜잭션을 수행 시 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것을 의미합니다. 이것은 트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미합니다. 은행 관리자는 이체 작업을 하는 도중에 쿼리를 실행하더라도 특정 계좌간 이체하는 양 쪽을 볼 수 없습니다. 공식적으로 고립성은 트랜잭션 실행내역은 연속적이여야 함을 의미합니다. 성능 관련 이유로 인해 이 특성은 가장 유연성 있는 제약입니다. 자세한 내용은 관련 문서를 참조해야 합니다.
  • Durability(지속성)은 성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미합니다. 시스템 문제, DB 일관성 체크 등을 하더라도 유지되어야 함을 의미합니다. 전형적으로 모든 트랜잭션은 로그로 남고 시스템 장애 발생 전 상태로 되돌릴 수 있습니다. 트랜잭션은 로그에 모든 것이 저장된 후에만 commit 상태로 간주될 수 있습니다.

NoSQL 데이터베이스

  • 비관계형 타입의 데이터를 저장할 때 주로 사용되는 데이터베이스 시스템입니다.
  • 관계형 데이터베이스와 다르게 비관계형이므로 데이터들을 저장하기 전에 정의할 필요가 없습니다.
    • 관계형 데이터베이스의 경우 데이터들을 저장하기 위해서는 어디에 어떻게 저장할 것인지를 정의해야 합니다.
    • 테이블 이름, 테이블과 다른 테이블의 관계, 각 컬럼의 타입 등등
  • MongoDB, Redis, Cassandra 등이 가장 대표적인 NoSQL 데이터베이스 입니다.

SQL(RDBMS) vs NoSQL

SQL

  • 장점:
    • 관계형 데이터베이스는 데이터를 보다 효율적으로 그리고 체계적으로 관리 및 저장할 수 있습니다.
    • 미리 저장하는 데이터들의 구조를 정의하기 때문에 데이터의 완전성이 보장됩니다.
    • 트랜잭션(transaction)
  • 단점:
    • 테이블을 미리 정의해야 하기 때문에 테이블 구조 변화 등에 덜 유연합니다.
    • 테이블 구조가 미리 정의되어 있기 때문에 단순히 서버를 늘리는 것으로 확장하기가 쉽지않고 서버의 성능 자체도 높여야 합니다.
    • 서버를 늘려서 분산 저장 하는 것도 쉽지 않습니다.

SQL은 정형화된 데이터들 그리고 데이터의 완전성이 중요한 데이터들을 저장하는데 유리합니다.
ex) 전자상거래 정보, 은행 계좌 정보, 거래 정보 등등

NoSQL

  • 장점:
    • 데이터 구조를 미리 정의하지 않아도 되기 때문에 저장하는 데이터의 구조변화에 유연합니다.
    • 확장을 할 때 서버 수만 늘리면 되기때문에 확장하기가 비교적 쉽습니다.
    • 그렇기 때문에 방대한 양의 데이터를 저장하는데 유리합니다.
  • 단점:
    • 데이터의 완전성이 덜 보장됩니다.
    • 트랜잭션이 되지않거나 비교적 불안정합니다.

NoSQL은 주로 비정형화된 데이터 그리고 완전성이 상대적으로 덜 유리한 데이터를 저장하는데 유리합니다.
ex) 로그 데이터 등

post-custom-banner

0개의 댓글