규칙의 목표는 테이블 간에 중복된 데이터를 허용하지 않는다는 것이다. 중복된 데이터를 허용하지 않음으로써 무결성(Integrity)를 유지할 수 있으며, DB의 저장 용량 역시 줄일 수 있다. 이러한 테이블을 분해하는 정규화 단계가 정의되어 있는데, 여기서 테이블을 어떻게 분해되는지에 따라 정규화 단계가 달라진다.
(보통, 3NF 정규화까지만 해도 충분하다고 함.)
<제1 정규화>
제1 정규화란 테이블의 컬럼이 원자값(Atomic Value, 하나의 값)을 갖도록 테이블을 분해하는 것.
아래 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제1 정규형을 만족하지 못하고 있다.
그렇기 때문에 이를 제1 정규화하여 분해할 수 있다.
제1 정규화를 진행한 테이블(한 컬럼에는 하나의 값만)
<제2 정규화>
제2 정규화란 제1 정규화를 진행한 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분해하는 것이다.
아래 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키를 갖고있고, (학생번호, 강좌이름)인 기본키는 강의실을 결정하고 있다.
하지만 여기서 강의실이라는 컬럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있다.
(강좌이름) --> (강의실)
그렇기 때문에 위의 테이블의 경우 아래와 같이 기존의 테이블에서 강의실을 분해하여 별도의 테이블로 관리하여 제2 정규형을 만족시킬 수 있다.
<제3 정규화>
제3 정규화란 제2정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해하는 것이다.
A -> B, B -> C
가 성립할 때 A -> C
가 성립되는 것을 의미한다.기존의 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있다.
따라서 이를 (학생 번호, 강좌 이름) 테이블과 (강좌 이름, 수강료) 테이블로 분해해야 한다.
이행적 종속을 제거하는 이유