Database - Normalization(정규화)

김준영·2023년 2월 1일
1

CS공부

목록 보기
5/20

정규화란?

  • 테이블 간 중복된 데이터를 허용하지 않는 것
  • 중복된 데이터를 만들지 않으면, 무결성을 유지할 수 있고, DB 저장 용량 또한 효율적으로 관리할 수 있다.

목적

  • 데이터의 중복을 없애면서 불필요한 데이터를 최소화시킨다.
  • 무결성을 지키고, 이상 현상을 방지한다.
  • 테이블 구성을 논리적이고 직관적으로 할 수 있다.
  • 데이터베이스 구조 확장에 용이해진다.

제 1정규화

테이블 컬럼이 원자값(하나의 값)을 갖도록 테이블을 분해하는 것

  • 어떤 릴레이션에 속한 모든 도메인이 원자값만으로 되어 있어야한다.
  • 모든 속성에 반복되는 그룹이 나타나지 않는다.
  • 기본키를 사용하여 관련 데이터의 각 집합을 고유하게 식별할 수 있어야 한다.

전화번호를 여러개 가지고 있어 1NF에 맞추기 위해 아래와 같이 분리한다.

제 2정규화

제 1정규화를 진행한 테이블의 모든 컬럼이 완전 함수적 종속을 만족해야 한다.

다시 말하면, 테이블에서 기본키가 복합키(키1, 키2)로 묶여있을 때, 두 키 중 하나의 키만으로 다른 컬럼을 결정지을 수 있으면 안된다.

기본키의 부분집합 키가 결정자가 되어선 안된다는 것이다.

Manufacturer과 Model이 키가 되어 Model Full Name을 알 수 있다.
Manufacturer Country는 Manufacturer로 인해 결정된다. (부분 함수 종속)
따라서, Model과 Manufacturer Country는 아무런 연관관계가 없는 상황이다.

따라서 아래와 같이 나눠 2NF를 만족시킨다.

제 3정규화

2NF가 진행된 테이블에서 이행적 종속을 없애기 위해 테이블을 분리하는 것
이행적 종속 : A -> B, B -> C 이면 A -> C가 성립

  • 릴레이션이 2NF에 만족한다.
  • 기본키가 아닌 속성들은 기본키에 의존한다.

현재 테이블에서는 Tournament와 Year이 기본키이며, Winner는 이 두 복합키를 통해 결정된다. 하지만 Winner Date of Birth는 기본키가 아닌 Winner에 의해 결정되고 있다.

3NF를 위반하고 있으므로 아래와 같이 분리해야 한다.

BCNF 정규화

제 3정규화를 진행한 테이블에 대해 모든 결정자가 후보키가 되도록 분해하는 것

특강수강 테이블에서 기본키는 (학생번호, 특강이름)이다. 그리고 기본키 (학생번호, 특강이름)는 교수를 결정하고 있다. 또한 여기서 교수는 특강이름을 결정하고 있다.
그런데 문제는 교수가 특강이름을 결정하는 결정자이지만, 후보키가 아니라는 점이다. 그렇기 때문에 BCNF 정규화를 만족시키기 위해서 위의 테이블을 분해해야 하는데, 다음과 같이 특강신청 테이블과 특강교수 테이블로 분해할 수 있다.


참조: https://gyoogle.dev/blog/computer-science/data-base/Normalization.html, https://mangkyu.tistory.com/110

profile
ㅎㅎ

0개의 댓글