개발 성장 일지

개발 성장 일지

Database

김효식 (HS KIM)·2020년 7월 12일

wecode

목록 보기

4/35

Database 기초 이해 및 설치

데이터를 저장 및 보존하는 시스템
Application에서는 데이터가 메모리 상에서 존재한다. 그리고 메모리에 존재하는 데이터는 보존되지 않는다. 해당 애플리케이션이 종료하면 메모리에 있던 데이터들은 다시 읽어 들일 수 없다.
그러므로 데이터를 장기간동안 저장 및 보존하기 위해 database를 사용한다.
일반적으로 database에는 크게 관계형 데이터베이스(RDBMS)와 NoSQL로 불리는 비관계형(Non-relational) database가 있다.

관계형 데이터베이스(RDBMS, Relational DataBase Management System)

관계형 데이터 모델에 기초를 둔 데이터베이스 시스템을 말한다.
관계형 데이터란 데이터를 서로 상호관련성을 가진 형태로 표현한 데이터를 말한다.
- 모든 데이터들은 2차원 테이블(table)들로 표현된다.
- 각각의 테이블은 컬럼(column)과 row(로우)로 구성된다.
  - 컬럼은 테이블의 각 항목을 말한다. (행)
  - 로우는 각 항목들의 실제 값들을 이야기 한다. (열)
- 각 로우는 고유 키(Primary Key)가 있다. 주로 Primary Key를 통해서 해당 로우를 찾는다.
각각의 테이블들은 서로 상호관련성을 가지고 서로 연결될 수 있다.
- 테이블끼리의 연결에는 크게 3가지 종류가 있다. (one to one, one to many many to many)
대표적인 관계형 데이터베이스에는 MySQL과 PostgreSQL이 있다.

One To One

테이블 A의 로우와 테이블 B의 로우가 정확히 일대일 매칭이 되는 관계를 말한다.

One To Many

테이블 A의 로우가 테이블 B의 여러 로우와 연결이 되는 관계를 말한다.

Many To Many

테이블 A의 여러 로우가 테이블 B의 여러 로우와 연결이 되는 관계를 말한다.

책은 여러 작가에 의해 쓰일 수 있고, 작가들은 여러 책을 쓸 수 있다.

테이블과 테이블 연결

Foreign Key(외부키)를 이용하여 주로 연결
one to one 예에서 user_profiles 테이블의 user_id 컬럼은 users 테이블에 걸려있는 외부키라고 지정한다.
데이터베이스에게 user_id의 값은 users 테이블의 id 값이며, 그러므로 users테이블의 id컬럼에 존재하는 값만 생성될 수 있다.
- users테이블에 없는 id값이 users_id에 지정되면 에러가 난다.

테이블들을 연결하는 이유

의문점 : 왜 하나의 테이블에 모든 정보를 저장하지 않고, 여러 테이블에 나누어서 저장할까?

하나의 테이블에 모든 정보를 다 넣으면 동일한 정보들이 불필요하게 중복되어 저장한다.
- 더 많은 디스크를 사용하게 되고, 잘못된 데이터가 저장될 가능성이 높아진다.
여러 테이블에 나누어서 저장한 후 필요한 테이블 끼리 연결시키면 위의 문제가 사라진다.
- 중복된 데이터를 저장하지 않음으로 디스크를 더 효율적으로 사용한다.
- 서로 같은 데이터이더라도, 부분적으로 다른 데이터가 생기는 문제점이 사라진다.
- 이것을 정규화(normalization)라고 한다.

ACID(Atomicity, Consistency, Isolation, Durability) - 원자성, 일관성, 고립성, 지속성

원자성(Atomicity)

트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는 능력이다.
예를 들어, 자금 이체는 성공할 수도 실패할 수도 있지만 보내는 쪽에서 돈을 빼오는 작업만 성공하고 받는 쪽에 돈을 넣는 작업을 실패해서는 안된다. 원자성은 이처럼 중간 단계까지 실행되고 실패하는 일이 없게 해준다.

일관성(Consistency)

트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 유지하는 것을 말한다.
무결성 제약이 모든 계좌는 잔고가 있어야 한다면, 이를 위반하는 트랜잭션은 중단된다.

고립성(Isolation)

트랜잭션을 수행 시 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것을 말한다.
트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미한다.
은행 관리자는 이체 작업을 하는 도중에 쿼리를 실행하더라도 특정 계좌간 이체하는 양 쪽을 볼 수 없다. 공식적으로 고립성은 트랜잭션 실행내역은 연속적이어야 함을 의미한다. 성능관련 이유로, 이 특성은 가장 유연성 있는 제약 조건이다.

지속성(Durability)

성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 말한다.
시스템 문제, DB 일관성 체크 등을 하더라도 유지되어야 한다.
전형적으로 모든 트랜잭션은 로그로 남고, 시스템 장애 발생 전 상태로 되돌릴 수 있다.
트랜잭션은 로그에 모든 것이 저장된 후에만 commit상태로 간주될 수 있다.

트랜잭션(Transaction)

ACID를 제공함으로 일련의 작업들을 한번에 하나의 unit으로 실행하는 기능을 제공한다.
일련의 작업들이 마치 하나의 작업처럼 취급되어서 모두 다 성공하거나, 실패하는 것을 말한다.
Commit & Rollback

NoSQL 데이터베이스

비관계형 타입의 데이터를 저장할 때 주로 사용되는 데이터베이스 시스템
관계형 데이터베이스와 다르게 비관계형이기 때문에 데이터들을 저장하기 전에 정의할 필요가 없다.
- 관계형 데이터베이스는 데이터들을 저장하기 전에 어디에 어떻게 저장할것인지 정의해야 한다.
  - 테이블 이름, 테이블과 다른 테이블의 관계, 각 컬럼의 타입
MongoDB, Redis, Cassandra 등이 가장 대표적인 NoSQL 데이터베이스다.

SQL(RDBMS)과 NoSQL의 장단점

SQL

장점
- 데이터를 더 효율적이고 체계적으로 저장, 관리할 수 있다.
- 미리 저장하는 데이터들의 구조(테이블 스키마)를 정의해서 데이터의 완전성이 보장된다.
- Transaction(트랜잭션)
- 정형화된 데이터들 그리고 데이터의 완전성이 중요한 데이터들을 저장하는데 유리하다.
  - ex) 전자상거래 정보, 은행 계좌 정보, 거래 정보 등
단점
- 테이블을 미리 정의하므로, 테이블 구조 변화 등에 덜 유연하다.
- 확장성이 쉽지 않다.
  - 테이블 구조가 미리 정의되어 있기 때문에, 단순히 서버를 늘리는 것만으로 확장하기 쉽지않고, 서버의 성능 자체도 높여야 한다(Scale up).
  - 서버를 늘려서 분산 저장하는 것도 쉽지 않다.

NoSQL

장점
- 데이터 구조를 미리 정의하지 않아도 되므로, 저장하는 데이터의 구조 변화에 유연하다.
- 확장하기가 비교적 쉽다. => 서버 수를 늘리면 된다. (Scale out)
- 확장하기 쉽고 데이터의 구조가 유연해서, 방대한 양의 데이터를 저장하는데 유리하다.
- 주로 비정형화된 데이터, 완전성이 상대적으로 덜 유리한 데이터를 저장하는데 유리하다.
  - ex) 로그 데이터
단점
- 데이터의 완전성이 덜 보장된다.
- 트랜잭션이 안되거나 비교적 불안정하다.

김효식 (HS KIM)

자기개발 :)

이전 포스트

API 서버 [인증(Authentication), 인가(Authorization)]

다음 포스트

HTTP & RESTful HTTP API

0개의 댓글