데이터베이스는 일정한 규칙을 통해 구조화되어 저장되는 데이터의 모음이다. 해당 데이터베이스를 제어하는 시스템을 DBMS라고 하며, 데이터베이스 안에 있는 데이터들은 삽입, 삭제, 수정 조회 등을 수행할 수 있다.
엔터티는 사람, 장소, 물건, 사건 등 여러 개의 속성을 지닌 명사를 의미한다. 엔터티는 약한 엔터티와 강한 엔터티로 나뉘는데 예를 들어 A가 혼자서는 존재하지 못하고 B의 존재 여부에 따라 종속적이라면 A가 약한 엔터티이고 B가 강한 엔터티 이다.
릴레이션은 데이터베이스에서 정보를 구분하여 저장되는 기본단위이다.엔터티에 관한 데이터를 데이터베이스는 릴레이션 하나에 담아서 관리한다. 릴레이션은 관계형 데이커베이스에서는 '테이블'이라고도 한다.
데이터베아스는 크게 관계형 데이터베이스와 NoSQL 데이터베이스로 나눌 수 있는데 관계형 데이터베이스는 MySQL이 대표적이고 NoSQL 데이터베이스의는 MongoDB가 대표적이다.
속성은 릴레이션에서 관리하는 구체적이며 고유한 이름을 갖는 정보이다. 관리해야 할 필요가 있는 속성들만 엔터티의 속성이 된다.
도메인은 릴레이션에 포함된 각각의 속성들이 가질 수 있는 값의 집합을 의미한다.
위의 그림을 보면 회원이라는 엔터티는 member라는 테이블로 속성인 이름, 아이디, 주소 등을 가지고 있으며 name, ID, address 라는 필드를 가진다. 그리고 이 테이블에 쌓이는 행 단위의 데이터를 레코드라고 한다. 이 레코드는 튜플이라는 이름으로 불리기도 한다.
필드는 타입을 갖는다. 예를 들어 이름은 문자열, 전화보는 숫자이다. DBMS마다 타입은 다르지만 mySQL을 기준으로 알아보겠다.
데이터베이스에 테이블은 여러 개가 존재하고 이러한 테이블은 서로의 관계가 정의되어 있다. 이러한 관계를 관계화살표로 나타낸다.
1:1 관계는 유저당 유저 이메일 한개씩 있는 이러한 관계를 의미한다.
1:N 관계는 한 유저당 여러 개의 상품을 장바구니에 넣어두는 관계를 의미한다. 물론 하나도 넣지 않은 0개도 포함되어야 한다.
학생과 강의의 관계를 정의하면 N:M 관계가 된다.
테이블 간의 관계를 조금 더 명확하게 하고 테이블 자체의 인덱스를 위해 설정된 장치를 의미한다. 기본키, 외래키, 후보키, 슈퍼키, 대체키가 있다.
슈퍼키는 유일성이 있고 후보키 중에서 기본키로 채택되지 못한 키가 대체키가 된다. 유일성은 중복되는 값이 없으며 최소성은 최소 필드만 써서 키를 형성할 수 있는 것을 말한다.
기본키는 유일성과 최소성을 만족하는 키이다. 이는 테이블의 데이터 중 고유하게 존재하는 속성이고 중복되면 안된다.
외래키는 다른 테이블의 기본키를 그대로 참조하는 값으로 개체와의 관계를 식별할 때 사용한다. 외래키는 중복되어도 상관없다.
후보키는 기본키가 될 수 있는 후보들이며 유일성과 최초성을 동시에 만족한다.
대체키는 후보키가 두 개 이상일 경우 어느 하나를 기본키로 지정하고 남은 후보키들을 말한다.
슈퍼키는 각 레코드를 유일하게 식별할 수 있는 유일성을 갖춘 키이다.