데이터베이스는 일정한 규칙, 혹은 규악을 통해 구조화되어 저장되는 데이터의 모음임. 해당 데이터베이스를 제어, 관리하는 통합 시스템을 DBMS라고 하며, 데이터베이스 안에 있는 데이터들은 특정 DBMS마다 정의된 쿼리 언어를 통해 삽입, 삭제, 수정, 조회 등을 수행할 수 있음. 또한, 데이터베이스는 실시간 접근과 동시 공유가 가능함.
데이터베이스 위에 DBMS가 있고 그 위에 응용 프로그램이 있으며, 이러한 구조를 기반으로 데이터를 주고 받음.
엔터티는 사람, 장소 물건, 사건, 개념 등 여러 개의 속성을 지닌 명사를 의미함. 서비스의 요구 사항에 맞춰 속성이 정해짐.
엔터티는 약한 엔터티와 강한 엔터티로 나뉨. 예를 들어 A가 혼자서는 존재하지 못하고 B의 존재 여부에 따라 종속적이라면 A는 약한 엔터티이고 B는 강한 엔터티가 됨. 예를 들어 방은 건물 안에만 존재하므로 방은 약한 엔터티라고 할 수 있고 건물은 강한 엔터티라고 할 수 있음.
데이터베이스에서 정보를 구분하여 저장하는 기본 단위임. 엔터티에 관한 데이터를 데이터베이스는 릴레이션 하나에 담아서 관리함. 릴레이션은 관계형 데이터베이스에서는 '테이블'이라고 하며, NoSQL 데이터베이스에서는 '컬렉션'이라고 함.
데이터베이스의 종류는 크게관게형 데이터베이스와 NoSQL 데이터베이스로 나눌 수 있음. 이 중 대표적인 관계형 데이터베이스인 MySQL과 대표적인 NoSQL 데이터베이스인 MongoDB를 예로 들면, MySQL의 구조는 레코드-테이블-데이터베이스로 이루어져 있고, MongoDB 데이터베이스의 구조는 도큐먼트-컬렉션-데이터베이스로 이루어져 있음. 레코드가 쌓여서 테이블이 되고 테이블이 쌓여서 데이터베이스가 되는 것임.
릴레이션에서 관리하는 구체적이며 고유한 이름을 갖는 정보임. 서비스의 요구 사항을 기반으로 관리해야 할 필요가 있는 속성들만 엔터티의 속성이 됨.
릴레이션에 포함된 각각의 속성들이 가질 수 있는 값의 집합을 말함. 예를 들어 성별이라는 속성이 있다면 이 속성이 가질 수 있는 값은 남, 여라는 집합이 됨.
앞선 정보를 바탕으로 데이터베이스에서 필드와 레코드로 구성된 테이블을 만들 수 있음.
회원이라는 엔터티는 member라는 테이블로 속성인 이름, 아이디 등을 가지고 있으며 name, ID, address 등의 필드를 가짐. 그리고 이 테이블에 쌓이는 행 단위의 데이터를 레코드 또는 튜플이라고 함.
엔터티를 데이터베이스에 넣어 테이블로 만들려면 속서엥 맞는 타입을 정의해야 함. 타입은 데이터베이스마다 조금씩 차이가 있음.
필드는 타입을 갖는데, 이는 DBMS마다 다름
숫자 타입
숫자 타입에는 TINYINT, SMALLINT, MEDIUMINT, INT, BIGINT 등이 있음
날짜 타입
날짜 타입에는 DATE, DATETIME, TIMESTAMP 등이 있음.
문자 타입
문자 타입에는 CHAR, VARCHAR, TEXT, BLOB, ENUM, SET이 있음.
(CHAR는 고정 길이 문자열이며 VARCHAR는 가변 길이 문자열임. TEXT와 BLOB은 큰 데이터를 저장할 때 사용함. ENUM과 SET은 문자열을 열거한 타입임.)
데이터베이스에 테이블은 하나만 있는 것이 아니고 여러 개의 테이블이 있고 이러한 테이블은 서로 관계가 정의되어 있음. 이러한 관계를 관계화살표로 나타냄.
테이블을 두 개의 테이블로 나눠 테이블의 구조를 더 이해하기 쉽게 만들어 줌.
한 개체가 다른 많은 개체를 포함하는 관계를 말함.
테이블 두 개를 직접적으로 연결해서 구축하지는 않고 1:N, 1:M 이라는 관계를 갖는 테이블 두 개로 나눠서 설정함.
테이블 간의 관계를 조금 더 명화갛게 하고 테이블 자체의 인덱스를 위해 설정된 장치로 기본키, 외래키, 후보키, 슈퍼키, 대체키가 있음
슈퍼키는 유일성이 있고 그 안에 포함된 후보키는 최소성까지 갖춘 키임. 후보키 중에서 기본키로 선택되지 못한 키는 대체키가 됨. 유일성은 중복되는 값은 없으며, 최소성은 필드를 조합하지 않고 최소 필드만 써서 키를 형성할 수 있는 것을 말함.
PK 또는 primary key라고 부르며, 유일성과 최소성을 만족하는 키임. 기본키는 자연키 또는 인조키 중에 골라 설정함.
중복된 값들을 제외하며 중복되지 않는 것을 '자연스레' 뽑다가 나오는 키를 자연키라고 함. 자연키는 언젠가는 변하는 속성을 가짐.
인위적으로 고유 식별자를 만드는 등 인위적으로 생성한 키를 인조키라고 하고 자연키와는 대조적으로 변하지 않음. 따라서 보통 기본키느 인조키로 설정함.
FK라고도 하며, 다른 테이블의 기본키를 그대로 참조하는 값으로 개체와의 관계를 식별하는 데 사용함. 외래키는 중복되어도 괜찮음.
기본키가 될 수 있는 후보들이며 유일성과 최소성을 동시에 만족하는 키임.
후보키가 두 개 이상일 경우 어느 하나를 기본키로 지정하고 남은 후보키들을 말함.
각 레코드를 유일하게 식별할 수 있는 유일성을 갖춘 키임.