데이터베이스란?
- 데이터를 저장 및 보관 하는 시스템
- 데이터를 장기 기간동안 저장 및 보관하기 위해서 사용
- 일반적으로 database에는 크게 관계형 데이터베이스와 비관계형 데이터베이스가 있다
관계형 데이터베이스(RDBMS)
- 이름 그대로, 관계형 데이터 모델에 기초를 둔 데이터베이스 시스템을 말한다.
ex) MYSQL, Postgres, Oracle DB
- 관계형 데이터란 서로 데이터를 상호관련성을 가진 형태로 표현한 데이터
- 모든 데이터를 2차원 테이블들로 표현된다
- 각각의 테이블은 컬럼과 로우로 구성된다
- 컬럼은 테이블의 각 항목
- 로우는 각 항목들의 실제 값들을 이야기한다.
- 각 로우는 저만의 고유키(Primary Key)가 있다. 주로 이 primary key를
통해서 해당 로우를 찾거나 인용한다.
- 각각의 테이블들은 서로 상호관련성을 가지고 서로 연결될 수 있다
- 테이블들끼리의 연결에는 크게 3 가지 종류가 있다
- One to One
- One to Many
- Many to Many
- One to One: 테이블 A의 로우와 테이블 B의 로우가 정확히 일대일 매칭이 관계를
말합니다.
- One to Many: 테이블 A의 로우가 테이블 B의 여러 로우와 연결되는 관계
- Many to Many : 테이블 A의 여러 로우가 테이블 B의 여러 로우와 연결되는 관계
어떻게 테이블과 테이블을 연결하는가?
- Foreign key(외부키)라는 개념을 사용하여 주로 연결
앞서 본 one to one 예에서 user_profiles 테이블의 user_id 컬럼은 user
테이블에 걸려있는 외부키라고 지정한다.
즉 데이터 베이스에게 user_id의 값은 users 테이블 id값이며 그러므로 users
테이블의 id 컬럼에 존재하는 값만 생성할수 있다
- 만일 users 테이블에 없는 id 값이 user_id에 지정되면 에러가 난다.
왜 테이블들을 연결하는가?
하나의 테이블에 모든 정보를 다 넣으면 동일한 정보들이 불필요하게 중복되어 저장된다.
(더 많은 디스크를 사용하게 되고 또한, 잘못된 데이터가 저장 될 가능성이 높아진다.)
여러 테이블에 나누어서 저장한후 필요한 테이블끼리 연결시키게 되면
중복된 데이터를 저장하지 않음으로 디스크를 더 효율적으로 쓰고,
또한 서로 같은 데이터지이지만 부분적으로 틀린 데이터가 생기는 문제가 없어진다.
이것을 정규화라고 한다.
ACID(Atomicity,Consistency,Isolation,Durability)
원자성, 일관성 ,고립성 , 지속성
-
원자성은 트랙잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는
능력
-
일관성은 트랜잭션이 실행을 성공적으로 완료하면 언제니 일관성이있는 데이터베이스 상태로 유
지하는 것을 의미한다.
-
고립성은 트랜잭션을 수행 시 다른 트랜잭션의 연산작업이 끼어들지 못하도록 보장하는 것을 의미
-
지속성은 성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미한다.시스템 문제, DB 일관성 체크 등을 하더라도 유지되어야 함을 의미한다
트랜잭션
- ACID를 제공함으로 따라서 트랜잭션(일련의 작업들을 한번에 하나의 unit으로 실행하는 것)
기능을 제공한다.
- 트랜잭션은 일련의 작업들이 마치 하나의 작업처럼 취급되어서 모두 다 성공하거나 아니면
모두다 실패하는 걸 이야기한다.
- commit & rollback
NoSQL 데이터베이스
- 비관계형 타입의 데이터를 저장할때 주로 사용되는 데이터 베이스 시스템
- 관계형 데이터베이스와 다르게 비관계형이기 떄문에 데이터를 저장하기 전에 정의할
필요가 없다.
MongoDB,Redis,Cassandra등이 가장 대표적인 NoSQL 데이터베이스이다.
관계형 데이터베이스 VS 비관계형데이터 베이스
SQL
- 장점:
- 관계형 데이터베이스는 데이터를 더 효율적으로 그리고 체계적으로 저장 및 관리가능
- 미리 저장하는 데이터들의 구조를 정의 함으로 데이터의 안정성 보장
- 트랜잭션
- 정형화된 데이터들 그리고 데이터의 완전성이 중요한데이터들을 저장하는데 유리하다.
-예) 전자상거래 정보, 은행 계좌정보 ,거래정보
- 단점:
- 테이블을 미리 정의해야 함으로 테이블 구조 변화등에 유연성이 떨어짐
- 확장성이 어려움
NoSQL
- 장점:
- 데이터 구조를 미리 정의하지 않아도 됨으로 저장하는 데이터의 구조변화에 유연함
- 확장하기가 비교적 쉽다(서버수를 늘리면됨(scale out))
- 확장하기 쉽고 데이터의 구조가 유연하여 방대한 양의 데이터를 저장하는데 유리
- 주로 비정형화 데이터 그리고 완저성이 상대적으로 덜 유리한 데이터를 저장하는데 유리
-예) 로그 데이타
- 단점:
- 데이터의 안전성이 덜 보장된다.