Database

Jina·2020년 4월 9일
0

Session

목록 보기
5/12
post-thumbnail

Database

데이터를 저장 및 보존 하는 시스템

Database 와 메모리

메모리에 존재하는 데이터는 보존이 되지않음(휘발성) 그러나 속도가 빠르다는 장점이 있음
따라서 데이터를 데이터베이스에 저장하고 메모리에서 읽어서 가공함

데이버베이스를 이용하면 데이터를 장기간동안 저장 및 보존 할 수 있음

관계형 데이터베이스 (RDBMS, Relational DataBase Management System)

관계형 데이터베이스

관계형 데이터 모델에 기초를 둔 데이터베이스 시스템
데이터를 저장하기 전에 정의해야함 (테이블 정의 - 테이블 이름, 테이블 사이의 관계 등)
대표적인 관계형 데이터베이스에는 MySQL과 PostgreSQL(Postgres)가 있음

관계형 데이터

  • 데이터를 서로 상호관련성을 가진 형태로 표현

    • 모든 데이터들은 2차원 테이블(table)로 표현
    • 각각의 테이블은 컬럼(column)과 row(로우)로 구성
    • cloumn : 테이블의 각 항목 / 행
    • row : 각 항목의 실제 값 / 열
    • 로우는 저만의 고유 키(Primary Key)가 존재함 / 이 primary key를 통해서 해당 로우를 찾거나 인용(reference)
  • 각각의 테이블들은 서로 상호관련성을 가지고 서로 연결될 수 있음

테이블의 연결

테이블끼리의 연결에는 크게 3가지 종류가 있음

one to one

테이블 A의 로우와 테이블 B의 로우가 정확히 일대일 매칭이 되는 관계

예시) users and user_profiles - one to one

one to many

테이블 A의 로우가 테이블 B의 여러 로우와 연결이 되는 관계
하나의 주체가 여러개의 상태값을 가짐

예시) 각 고객은 여러 제품을 구매할 수 있지만 구매된 제품의 주인은 오직 한 고객 뿐임

many to many

테이블 A의 여러 로우가 테이블 B의 여러 로우와 연결이 되는 관계

예시) 책은 여러 작가에 의해 쓰일 수 있고 작가들은 여러 책을 쓸 수 있음


테이블과 테이블 연결방법

주로 Foreign key(외부키)라는 개념을 사용해서 연결

one to one 예시 )
user_profiles 테이블의 user_id 컬럼은 users 테이블에 걸려있는 외부 키라고 지정
데이터베이스에게 user_id의 값은 users 테이블의 id 값 --> 따라서 users 테이블의 id 컬럼에 존재하는 값만 생성될 수 있음
만일 users 테이블에 없는 id 값이 user_id 에 지정되면 에러발생

테이블 연결 이유

하나의 테이블에 모든 정보를 다 넣으면 동일한 정보들이 불필요하게 중복되어 저장됨
따라서 더 많은 디스크를 사용하게 되고 잘못된 데이터가 저장 될 가능성이 높아짐

테이블을 연결해서 사용하면 중복된 데이터를 저장하지않기 때문에 디스크를 더 효율적으로 쓰고 잘못된 데이터를 저장할 가능성이 낮아짐
이것을 normalization(정규화)라고 함

트랜잭션(Transaction)

  • 질의를 하나의 묶음 처리해서 중간에 실행이 중단되면 처음부터 다시 실행(rollback)하고 오류없이 마치면 커밋(commit)하는 것

  • 한번의 질의가 실행되면 모두 실행되거나 모두 실행되지않거나

  • 트랜잭션의 특성 ACID

예시) 만약 송금할 때 오류가 발생하면 다시 처음부터 실행해야 하는 것 / 이 과정이 없으면 송금 중 오류가 발생하여 돈을 보낸 사람은 있으나 받은 사람은 없는 등의 문제가 발생할 수 있음

ACID(Atomicity, Consistency, Isolation, Durability)

원자성, 일관성, 고립성, 지속성

원자성(Atomicity)

트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는 능력 (all or nothing)

일관성(Consistency)

트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 유지하는 것

고립성(Isolation)

트랜잭션을 수행 시 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것
트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미

지속성(Durability)

성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미
시스템 문제, DB 일관성 체크 등을 하더라도 유지되어야 함을 의미
전형적으로 모든 트랜잭션은 로그로 남고 시스템 장애 발생 전 상태로 되돌릴 수 있음 (트랜잭션은 로그에 모든 것이 저장된 후에만 commit 상태로 간주될 수 있음)

NoSQL 데이터베이스

비관계형 타입의 데이터를 저장할때 주로 사용되는 데이터베이스 시스템
데이터를 저장하기 전에 테이블을 정의할 필요가 없음
빠른 저장이 필요한 데이터를 저장할때
MongoDB, Redis, Cassandra 등이 있음

SQL(RDBMS) VS NoSQL

SQL

장점

  • 데이터를 체계적이고 효율적으로 저장 및 관리할 수 있음
  • 저장하는 데이터들의 구조(테이블 스키마)를 미리 정의 함으로 데이터의 완전성이 보장됨
  • 트랜잭션(transaction)을 통해 안정적인 작업가능

단점

  • 테이블을 미리 정의해야 함으로 테이블 구조 변화 등에 유연성이 떨어짐
  • 확장성이 쉽지 않음
    • 서버를 늘리는 것으로 확장하기 쉽지 않음
    • 서버의 성능 자체를 높여야함 (Scale up)
  • 서버를 늘려서 분산 저장 하는것이 쉽지 않음

예시

정형화된 데이터, 데이터의 완전성이 중요한 데이터 등을 저장하는데 유리함
예시) 전자상거래 정보, 은행 계좌 정보, 거래 정보 등

NoSQL

장점

  • 테이터 구조를 미리 정의하지 않아도 되기 때문에 저장하는 데이터의 구조 변화에 유연함
  • 확장하기가 비교적 쉬움
    • 서버 수를 늘리면 됨 (Scale out)
  • 방대한 양의 데이터를 저장하는데 유리함

단점

  • 데이터의 완전성이 덜 보장됨
  • 트랜잭션이 안되거나 비교적 불안정

예시

주로 비정형화 데이터 그리고 완전성이 상대적으로 덜 유리한 데이터를 저장하는데 유리함
예시) 로그 데이타

0개의 댓글