TIL#56 DATABASE

Dasom·2020년 9월 6일
1

Django

목록 보기
4/33

Database

  • 데이터를 저장 및 보존하는 시스템
  • Application에서는 데이터가 메모리 상에서 존재한다. 메모리에 존재하는 데이터는 보존되지 않는다. 해당 Application이 종료되면 메모리에 있던 데이터들은 다시 읽어들일 수 없다.
  • 데이터를 장기간 저장 및 보존하기 위해서 데이터베이스를 사용
  • 일반적으로 크게 관계형 데이터베이스(RDBMS)와 "NoSQL"로 명칭되는 비관계형(Non-relational) 데이터베이스가 있다.

관계형 데이터베이스(RDBMS, Relational DataBase Management System)

  • 관계형 데이터 모델에 기초를 둔 데이터 베이스 시스템

  • ex. MySQL, Postgres, Oracle DB

  • 관계형 데이터 : 서로 상호관련성을 가진 형태로 표현한 데이터

    • 모든 데이터들은 2차원 테이블로 표현
    • 각각의 테이블은 컬럼(column)과 로우(row)로 구성
      • 컬럼은 테이블의 각 항목을 말한다
      • 로우는 각 항목들의 실제 값들을 말한다
      • 각 로우는 자기만의 고유 키(Primary Key)가 있다. 주로 이 primary key를 통해서 해당 로우를 찾거나 인용(reference)하게 된다.
  • 각각의 테이블은 서로 상호 관련성을 가지고 서로 연결될 수 있다.

    • 테이블 끼리의 연결에는 크게 3종류가 있다
      • one to one : table A의 row 와 table B의 row가 정확히 일대일 매칭이 되는 관계
      • one to many : table A의 row가 table B의 여러 row와 연결이 되는 관계 (ex. 각 고객은 여러 제품을 구매할 수 있지만 구매된 제품의 주인은 오직 한 고객뿐이다, 각 출판사는 여러 작가들과 계약을 할 수 있지만 작가는 한 출판사랑만 계약할 수 있다)
      • many to many : table A의 여러 row 가 table B의 여러 row와 연결이 되는 관계 (ex. 책은 여러 작가에 의해 쓰일 수 있고 작가들은 여러 책을 쓸 수 있다)

어떻게 테이블과 테이블을 연결하는가

  • Foreign Key(외부키)라는 개념을 사용하여 주로 연결
  • 만일 테이블에 없는 id 값이 지정되면 에러가 발생한다

왜 테이블들을 연결하는가

  • 하나의 테이블에 모든 정보를 다 넣으면
    • 동일한 정보들이 불필요하게 중복되어 저장될 수 있다.
    • 더 많은 디스크를 사용하게 된다
    • 잘못된 데이터가 저장될 가능성이 높아진다
  • 여러 테이블에 나누어서 저장한 후 필요한 테이블끼리 연결시키면
    • 중복된 데이터를 저장하지 않아서 디스크를 더 효율적으로 쓸 수 있다
    • 서로 같은 데이터이지만 부분적으로 틀린 데이터가 생기는 문제가 없어진다
    • 이것을 normalization(정규화)라고 한다.

ACID(Atomicity, Consistency, Isolation, Durability)

  • 원자성, 일관성, 고립성, 지속성

  • 원자성(Atomicity) : 트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는 능력. (ex. 자금이체에서 보내는 쪽에서 돈을 빼오는 작업만 성공하고 받는 쪽에 돈을 넣는 작업을 실패하면 안된다.) 원자성은 이와 같이 중간단계까지 실행되고 실패하는 일이 없도록 하는 것.

  • ❗️ 트랜잭션(Transaction) : 데이터베이스의 상태를 변환시키는 하나의 논리적 기능을 수행하기 위한 작업의 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산을 의미

  • 일관성(Consistency) : 트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터 베이스 상태로 유지하는 것을 의미.

  • 고립성(Isolation) : 트랜잭션 수행 시 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것. 트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미. 가장 유연성 있는 제약 조건.

  • 지속성(Durability) : 성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미. 시스템 문제, DB 일관성 체크를 하더라도 유지되어야 함.

NoSQL 데이터베이스

  • 비관계형 타입의 데이터를 저장할 때 주로 사용
  • 비관계형이기 때문에 데이터들을 저장하기 전에 정의할 필요가 없다
  • MongoDB, Redis, Cassandra 등이 대표적임

SQL(RDBMS) & NoSQL

SQL

  • 장점
    • 데이터를 더 효율적, 체계적으로 저장할 수 있고 관리할 수 있다
    • 미리 저장하는 데이터들의 구조(테이블 스키마)를 정의함으로 데이터의 완전성이 보장
    • 트랜잭션(transaction)
    • 정형화된 데이터들 그리고 데이터의 완전성이 중요한 데이터들을 저장하는데 유리
      • ex. 전자상거래 정보, 은행계좌정보, 거래정보 등
  • 단점
    • 테이블을 미리 정의해야 해서 테이블 구조 변화 등에 덜 유연
    • 확장성이 쉽지 않음
      • 테이블 구조가 미리 정의되어 있어서 단순히 서버를 늘리는 것만으로는 확장하기가 쉽지 않고 서버의 성능 자체도 높여야 한다
      • 서버를 늘려서 분산저장하는 것도 쉽지 않다
      • scale up (서버의 성능을 높이는 것)으로 확장성이 된다

NoSQL

  • 장점
    • 데이터 구조를 미리 정의하지 않아도 되어서 저장하는 데이터의 구조변화에 유연
    • 확장하기가 비교적 쉽다. 그냥 서버수를 늘리면 된다(scale out)
    • 방대한 양의 데이터를 저장하는데 유리
    • 주로 비정형화 데이터, 완전성이 상대적으로 덜 유리한 데이터를 저장하는데 유리
      • ex. 로그 데이터
  • 단점
    • 데이터의 완전성이 덜 보장된다
    • 트랜잭션이 안되거나 비교적 불안정하다
profile
개발자꿈나무🌲

0개의 댓글