✔️ What You Will Learn
- 데이터베이스란?
- RDBMS란? 왜 관계형 테이블을 쓰는가?
- TABLE이란? Column과 Row 그리고 Primary Key란?
- 테이블의 관계 , One to One, One to Many, Many to Many는 무엇인가?
- 트랜잭션이란? ACID는 무엇인가?
- 관계형 데이터베이스 와 비관계형 데이터베이스의 차이는?
- ERD 구성도로 모델링하기
✔️Contents
1. Database 기초 이해
[데이터베이스란?]
A database generally refers to a structured collection of structured information or data stored electronically in a computer system. The database is usually controlled by a database management system (DBMS). Data and DBMS are referred to as 'database systems' along with related applications, and are also collectively referred to as 'databases' for short.
-
Database
란 일반적으로 컴퓨터 시스템에 저장된 정보 또는 데이터의 집합을 의미합니다.
- 데이터를 영구적 저장하고 연산하고 보존하기 위해서
- 데이터를 저장하고 편집 가공 및 보존을 편리하게 해주는 시스템이다.
-
Database
는 보통 데이터베이스 관리 시스템(DBMS)(=관계형 데이터베이스)로 제어합니다. 데이터와 DBMS는 연관된 어플리케이션들과 함께 '데이터베이스 시스템'으로 일컬어지며, 더 짧게는 Database
라고 통칭되기도 합니다
-
반대되는 건 memory
(휘발성, 영구적이지 않은느낌)
Application
에서는 데이터가 memory
상에서 존재합니다. memory
에 존재하는 데이터는 보존이 되지 않기 때문에 애플리케이션이 종료하면 메모리에 있던 데이터들은 다시 읽어 들일 수 없습니다.
따라서, 데이터를 오랜 기간 저장 및 보존 하기 위해서 database
를 사용하는 것입니다.
- 일반적으로
database
에는 크게 관계형 데이터베이스(RDBMS)와 "NoSQL(=Structured Quary Language)"로 명칭되는 비관계형(Non-relational) database가 있습니다.
2. 관계형 데이터베이스(RDBMS | Relational DataBase Management System)
이름 그대로, **관계형 데이터 모델**
에 기초를 둔 데이터베이스 시스템을 말합니다.
- ex) MySQL, Postgres(지도 데이터 다룰 때 특화/ 배달하는 앱만드는회사/ 오라클이랑 호환이 좋음), Oracle DB
관계형 데이터
란 데이터를 서로 상호관련성을 가진 형태로 표현한 데이터를 말합니다.
- 모든 데이터들은 2차원 테이블(table)들로 표현할 수 있습니다.

- 각각의 테이블은 컬럼(column)과 row(로우)로 구성되어 있습니다.
- 컬럼은 테이블의 각 항목을 말합니다.
- 로우는 각 항목들의 실제 값들을 이야기 합니다.
- 각 로우는 저만의 고유 키(
Primary Key
)가 있습니다. 주로 이 primary key를
통해서 해당 로우를 찾거나 인용(reference)하게 됩니다.
- 각각의 테이블들은 서로 상호관련성을 가지고 서로 연결될 수 있습니다.
- 테이블끼리의 연결에는 크게 3가지 종류가 있습니다.
- one to one
- one to many
- many to many
One To One
- 테이블 A의 로우와 테이블 B의 로우가 정확히 일대일 매칭이 되는 관계를 one to one 관계라고 합니다.
- 하나의 유저는 하나의 프로필만 가질 수 있음

One To Many
- 테이블 A의 로우가 테이블 B의 여러 로우와 연결이 되는 관계를 one to many 관계라고 합니다.
- 각 고객은 여러 제품을 구매할 수 있지만 구매된 제품의 주인은 오직 한 고객 뿐이다

Many To Many
- 테이블 A의 여러 로우가 테이블 B의 여러 로우와 연결이 되는 관계를 many to many 라고 합니다.
- 책은 여러 작가에 의해 쓰일 수 있고 작가들은 여러 책을 쓸 수 있다 - many to many

어떻게 테이블과 테이블을 연결하는가?
- Foreign key(외부키)라는 개념을 사용하여 주로 연결합니다
- 앞서 본 one to one 예에서 user_profiles 테이블의 user_id 컬럼은 users 테이블에 걸려있는 외부 키라고 지정합니다.
- 즉 데이터베이스에게 user_id의 값은 users 테이블의 id 값이며 그러므로 users 테이블의 id 컬럼에 존재하는 값만 생성될 수 있습니다.
- 만일 users 테이블에 없는 id 값이 user_id 에 지정되면 에러가 발생합니다.
왜 테이블들을 연결하는가?
- 먼저 왜 정보를 여러 테이블에 나누어서 저장하는가?
- 앞서 본 one to many의 예에 경우, 그냥 하나의 테이블에 고객 정보와 구입한 제품 정보 모두를 저장 하면 안되나 ?
- 하나의 테이블에 모든 정보를 다 넣으면 동일한 정보들이 불필요하게 중복되어 저장됩니다.
- 더 많은 디스크를 사용하게 되고, 잘못된 데이터가 저장 될 가능성이 높아집니다.
- ex) 고객의 아이디는 동일한데 이름이 서로 다른 로우들이 있다면 어떻게 해야 할까요? 어떤 이름이 정확할까요?
- 여러 테이블에 나누어서 저장한후 필요한 테이블 끼리 연결 시키면 위의 두 문제가 사라집니다.
- 중복된 데이터를 저장하지 않음으로 디스크를 더 효율적으로 쓰고,
- 또한 서로 같은 데이터이지만 부분적으로만 내용이 다른 데이터가 생기는 문제가 없어집니다.
***This is normalization
(정규화)
ACID(Atomicity, Consistency, Isolation, Durability)
원자성, 일관성, 고립성, 지속성
원자성(Atomicity)
은 트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는 능력입니다.
- 예를 들어, 자금 이체는 성공할 수도 실패할 수도 있지만 보내는 쪽에서 돈을 빼 오는 작업만 성공하고 받는 쪽에 돈을 넣는 작업을 실패해서는 안됩니다. 원자성은 이와 같이 중간 단계까지 실행되고 실패하는 일이 없도록 하는 것입니다.
일관성(Consistency)
은 트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 유지하는 것을 의미합니다.
- 무결성 제약이 모든 계좌는 잔고가 있어야 한다면 이를 위반하는 트랜잭션은 중단됩니다.
고립성(Isolation)
은 트랜잭션을 수행 시 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것을 의미합니다.
- 이것은 트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미합니다.
- 은행 관리자는 이체 작업을 하는 도중에 쿼리를 실행하더라도 특정 계좌간 이체하는 양 쪽을 볼 수 없습니다. 공식적으로 고립성은 트랜잭션 실행내역은 연속적이어야 함을 의미합니다. 성능관련 이유로 인해 이 특성은 가장 유연성 있는 제약 조건입니다. 자세한 내용은 관련 문서를 참조해야 합니다.
지속성(Durability)
은 성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미합니다.
- 시스템 문제, DB 일관성 체크 등을 하더라도 유지되어야 함을 의미합니다. 전형적으로 모든 트랜잭션은 로그로 남고 시스템 장애 발생 전 상태로 되돌릴 수 있습니다. 트랜잭션은 로그에 모든 것이 저장된 후에만 commit 상태로 간주될 수 있습니다.
트랜잭션(Transaction)
3. NoSQL 데이터베이스
- 언제 쓰죠 ?
- 비관계형 타입의 데이터를 저장할때 주로 사용되는 데이터베이스 시스템
- 비관계형 데이터베이스는 데이터들을 저장하기 전에 정의 할 필요가 없다.
- 관계형 데이터베이스는 데이터들을 저장하기 전에 어디에 어떻게 저장할것인지를 정의 해야한다.
- 즉 테이블을 RDBM정의해야함 (테이블 이름, 테이블과 다른 테이블의 관계, 각 컬럼의 타입 등등)
- MongoDB, Redis, Cassandra 등이 가장 대표적인 NoSQL 데이터 베이스이다.
4. SQL(RDBMS) VS NoSQL
SQL
- Strength:
- 관계형 데이터베이스는 데이터를 더 효율적으로 그리고 체계적으로 저장할 수 있고 관리 할 수 있다.
- 미리 저장하는 데이터들의 구조(테이블 스키마)를 정의 함으로 데이터의 완전성이 보장할 수 있다.
- 트랜잭션(transaction)
- Weakness:
- 테이블을 미리 정의해야 하므로 테이블 구조 변화 등에 덜 유연한다.
- 확장성이 쉽지 않다.
- 역시 테이블 구조가 미리 정의 되어 있다보니 단순히 서버를 늘리는것 만으로 확장하기가 쉽지 않고 서버의 성능 자체도 높여야 한다.
- 서버를 늘려서 분산 저장 하는것도 쉽지 않다.
- Scale up (서버의 성능을 높이는것 "not scale out")으로 확장성이 됨.
- 정형화된 데이터들 그리고 데이터의 완전성이 중요한 데이터들을 저장하는데 유리하다.
- 예) 전자상거래 정보. 은행 계좌 정보, 거래 정보 등등.
NoSQL
- Strength:
- 테이터 구조를 미리 정의하지 않아도 되므로 저장하는 데이터의 구조 변화에 유연하다.
- 확장하기가 비교적 쉽다. 그냥 서버 수를 늘리면 됨(scale out)
- 확장하기가 쉽고 테이터의 구조도 유연하다 보니 방대한 양의 데이터를 저장하는데 유리하다.
- Weakness:
- 데이터의 완전성이 덜 보장된다.
- 트랜잭션이 안되거나 비교적 불안정하다.
- 주로 비정형화 데이터 그리고 완전성이 상대적으로 덜 유리한 데이터를 저장하는데 유리하다.
- 예) 로그 데이타
✔️Materials
✔️ Team Assignment
- 스타벅스의
음료
에 관한 정보를 팀별로 모델링하기
Starbucks
✔️ Normalization rules
제 1 정규화, 제 2 정규화, 제 3정규화 등
- 정규화(Normalization)을 하는 데에는 규칙이 있습니다. 그러나 이를 먼저 공부하는 것은 이해하기 쉽지 않기 때문에 과제를 모두 진행한 후, 데이터베이스에 대한 이해가 잡히면 그 때 다시 이론을 공부해보시는 것을 추천드립니다.
정규화 (제1 정규화 ~ 제3 정규화)