데이터베이스의 기본

Ryu·2023년 5월 4일
0

데이터베이스란?

데이터베이스(DB, DataBase)는 일정한 규칙, 혹은 규약을 통해 구조화되어 저장되는 데이터의 모음입니다.

해당 데이터베이스를 제어, 관리하는 통합 시스템을 DBMS(DataBase Management System)라고 하며, 데이터베이스 안에 있는 데이터들은 특정 DBMS마다 정의된 쿼리 언어를 통해 삽입, 삭제, 수정, 조회 등을 수행할 수 있습니다.
또한, 데이터베이스는 실시간 접근과 동시 공유가 가능합니다.

엔터티

엔터티(entity)는 사람, 장소, 물건, 사건, 개념 등 여러 개의 속성을 지닌 명사를 의미합니다.

약한 엔터티와 강한 엔터티

엔터티는 약한 엔터티와 강한 엔터티로 나뉘는데, 예를 들어 A가 혼자서는 존재하지 못하고 B의 존재 여부에 따라 종속적이라면 A는 약한 엔터티이고 B는 강한 엔터티가 됩니다.

릴레이션

릴레이션(relation)은 데이터베이스에서 정보를 구분하여 저장하는 기본 단위입니다. 엔터티에 관한 데이터를 데이터베이스는 릴레이션 하나에 담아서 관리합니다.

릴레이션은 관계형 데이터베이스에서는 '테이블'이라고 하며, NoSQL 데이터베이스에서는 '컬렉션'이라고 합니다.

테이블과 컬렉션

데이터베이스의 종류는 크게 관계형 데이터베이스와 NoSQL 데이터베이스로 나눌 수 있습니다. 이 때 대표적인 관계형 데이터베이스인 MySQL과 대표적인 NoSQL 데이터베이스인 MongoDB를 예로 들면, MySQL의 구조는 레코드-테이블-데이터베이스로 이루어져 있고 MongoDB 데이터베이스의 구조는 도큐먼트-컬렉션-데이터베이스로 이루어져 있습니다.

레코드가 쌓여 테이블이 되고 테이블이 쌓여서 데이터베이스가 됩니다.

속성

속성(attribute)은 릴레이션에서 관리하는 구체적이며 고유한 이름을 갖는 정보입니다.

도메인

도메인(domain)이란 릴레이션에 포함된 각각의 속성들이 가질 수 있는 값의 집합을 말합니다. ex) 속성 : 성별 / 도메인 : {남, 여}

필드와 레코드

필드타입

필드는 타입을 갖습니다. 예를 들어 이름은 문자열이고 전화번호는 숫자겠죠?
이러한 타입들은 DBMS마다 다르며 MYSQL을 기준으로 설명하겠습니다.

숫자타입


날짜타입

DATE
날짜 부분은 있지만 시간 부분은 없는 값에 사용됩니다.
지원되는 번위는 1000-01-01~9999-12-31이고 3바이트의 용량을 가집니다.

DATETIME
날짜 및 시간 부분을 모두 포함하는 값에 사용됩니다.
지원되는 범위는 1000-01-01 00:00:00에서 9999-12-31 23:59:59이고 8바이트의 용량을 가집니다.

TIMESTAMP
날짜 및 시간 부분을 모두 포함하는 값에 사용됩니다.
지원되는 범위는 1970-01-01 00:00:01에서 2038-01-19 03:14:07이고 4바이트의 용량을 가집니다.


문자 타입

CHAR와 VARCHAR
CHAR는 고정 길이 문자열이며 길이는 0에서 255 사이의 값을 가집니다.

VARCHAR는 가변 길이 문자열입니다. 길이는 0에서 65,535 사이의 값으로 지정할 수 있으며, 입력된 데이터에 따라 용량을 가변시켜 저장합니다.

TEXT와 BLOB
두 타입 모두 큰 데이터를 저장할 때 쓰는 타입입니다.
TEXT는 큰 문자열 저장에 주로 쓰며, BLOB은 이미지, 동영상 등 큰 데이터 저장에 씁니다.

ENUM과 SET
두 타입 모두 문자열을 열거한 타입입니다.

ENUM은 ENUM('x-small', 'small', 'medium', 'large', 'x-large') 형태로 쓰이며, 이 중에서 하나만 선택하는 단일 선택만 가능하고 ENUM 리스트에 없는 잘못된 값을 삽입하면 빈 문자열이 대신 삽입됩니다.
ENUM은 최대 65,535개의 요소를 넣을 수 있습니다.

SET는 여러 개의 데이터를 선택할 수 있고 비트 단위의 연산을 할 수 있으며 최대 64개의 요소를 집어넣을 수 있습니다.


관계

1:1 관계

위 그림에서 한 명의 직원은 하나의 사원증을 가질 수 있기 때문에 1:1 관계입니다.

1:N 관계

위 그림에서 한 부서 내에서 여러 명의 직원이 존재할 수 있으므로 1:N 관계입니다.

N:M 관계

위 그림에서 직원은 여러 개의 자격증을 가질 수 있고 자격증도 여러 직원을 포함할 수 있기 때문에 N:M 관계입니다.

테이블 간의 관계를 조금 더 명확하게 하고 테이블 자체의 인덱스를 위해 설정된 장치로 기본키, 외래키, 후보키, 슈퍼키, 대체키가 있습니다.

유일성 : 중복되는 값이 없다. 
최소성 : 필드를 조합하지 않고 최소 필드만 써서 키를 형성할 수 있다. 

기본키

기본키(Primary Key)는 줄여서 PK 또는 프라이머리키라고 많이 부르며, 유일성과 최소성을 만족하는 키입니다. 이는 테이블의 데이터 중 고유하게 존재하는 속성입니다.


위 그림에서 고객 아이디는 겹칠 수 없기 때문에 기본키가 됩니다.

기본키는 자연키 또는 인조키 중에 골라 설정합니다.

자연키

예를 들어 유저 테이블을 만든다고 가정하면 주민등록번호, 이름, 성별 등의 속성이 있습니다. 이 중 이름, 성별 등은 중복된 값이 들어올 수 있습니다. 중복되지 않는 것을 자연스레 뽑다가 나오는 키를 자연키라고 합니다. 자연키는 언젠가는 변하는 속성을 가집니다.

인조키

예를 들어 유저 테이블을 만든다고 했을 때 회원 테이블을 생성한다고 가정하면 주민등록번호, 이름, 성별 등의 속성이 있습니다. 여기에 인위적으로 유저 아이디를 부여합니다. 이를 통해 고유 식별자가 생겨납니다. 이렇게 인위적으로 생성한 키를 인조키라고 합니다. 자연키와는 대조적으로 변하지 않습니다. 따라서 보통 기본키는 인조키로 설정합니다.

외래키

외래키(Foreign Key)는 FK라고도 하며, 다른 테이블의 기본키를 그대로 참조하는 값으로 개체와의 관계를 식별하는데 사용합니다.


위 그림을 보면 client라는 테이블의 기본키인 ID가 product라는 테이블의 user_id라는 외래키로 설정될 수 있음을 보여줍니다.

후보키

후보키(candidate key)는 기본키가 될 수 있는 후보들이며 유일성과 최소성을 동시에 만족하는 키입니다.

대체키

대체키(alternate key)는 후보키가 두 개 이상일 경우 어느 하나를 기본키로 지정하고 남은 후보키들을 말합니다.

슈퍼키

슈퍼키(super key)는 각 레코드를 유일하게 식별할 수 있는 유일성을 갖춘 키입니다.

profile
나는야 머찐 개발자

0개의 댓글