정규화(Normalization)

이상우·2021년 12월 17일
0

정규화(Normalization)이란?
정규화(Normalization)의 기본 목표는 테이블 간에 중복된 데이타를 허용하지 않는다는 것이다. 중복된 데이터를 허용하지 않음으로써 무결성(Integrity)를 유지할 수 있으며, DB의 저장 용량 역시 줄일 수 있다.

이러한 테이블을 분해하는 정규화 단계가 정의되어 있는데, 여기서 테이블을 어떻게 분해되는지에 따라 정규화 단계가 달라지는데, 각각의 정규화 단계에 대해 자세히 알아보도록 하자.

1차 정규화(1NF)란?
각 속성마다 값이 1개씩 존재하도록 하는 과정(원자화)

아래와 같이 고객 취미 테이블이 존재한다고 하자.

이름취미
김연아인터넷
추신수영화,음악
박세리음악, 쇼핑
장미란음악
박지성게임

위의 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제 1정규형을 만족하지 못하고 있다. 그렇기 때문에 제 1정규화할 수 있는데, 진행하게 되면 아래와 같이 된다.

이름취미
김연아인터넷
추신수영화
추신수음악
박세리음악
박세리쇼핑
장미란음악
박지성게임

2차 정규화(2NF)란?
복합키로 구성 되어있을 때 고려해야하며 모든 속성이 완전 함수 종속이 되도록 하는 작업
예를 들면 아래와 같은 수강 강좌 테이블을 보자.

  • 완전 함수 종속: A,B,C,D가 있을 때 B가 A에 의해 종속되는 경우
    B는 다른 내용(C,D)에 의해 종속이 되지 않는 경우

수강강좌 테이블

학생번호강좌이름강의실성적
501데이터베이스공학관 1103.5
401데이터베이스공학관 1104.0
402스포츠경영학체육관 1033.5
502자료구조공학관 1114.0
501자료구조공학관 1113.5

이 테이블에서 기본키는(학생번호, 강좌이름)으로 복합키이다. 그리고 (학생번호, 강좌이름)인 기본키는 성적을 결정하고 있다. (학생번호, 강좌이름) --> (성적)
그런데 여기서 강의실이라는 컬럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있다. (강좌이름) --> (강의실)
즉, 기본키(학생번호, 강좌이름)의 부분키인 강좌이름이 결정자이기 때문에 위의 테이블의 경우 다음과 같이 기존의 테이블에서 강의실을 분해하여 별도의 테이블로 관리하여 제2 정규형을 만족시킬 수 있다.

3차 정규화(3NF)란?
테이블 내에서 이행적 요소를 제거하는 작업
*이행적 요소: 이행적 종속이라는 것은 A -> B, B -> C가 성립할 때 A -> C가 성립되는 것을 의미한다.

예를들면, 아래와 같은 계절학기 테이블을 살펴보자.

계절학기 테이블

학생번호강좌이름수강료
501데이터베이스20000
401데이터베이스20000
402스포츠경영학15000
502자료구조25000

기존의 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있다. 그렇기 때문에 이를 (학생 번호, 강좌 이름) 테이블과 (강좌 이름, 수강료) 테이블로 분해해야 한다.

이행적 종속을 제거하는 이유는 비교적 간단하다. 예를 들어 501번 학생이 수강하는 강좌가 스포츠경영학으로 변경되었다고 하자. 이행적 종속이 존재한다면 501번의 학생은 스포츠경영학이라는 수업을 20000원이라는 수강료로 듣게 된다. 물론 강좌 이름에 맞게 수강료를 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제3 정규화를 하는 것이다.
즉, 학생 번호를 통해 강좌 이름을 참조하고, 강좌 이름으로 수강료를 참조하도록 테이블을 분해해야 하며 그 결과는 다음의 그림과 같다.

계절수강 테이블

학생번호강좌이름
501데이터베이스
401데이터베이스
402스포츠경영학
502자료구조

수강료 테이블

강좌이름수강료
데이터베이스20000
데이터베이스20000
스포츠경영학15000
자료구조25000
profile
구상한것을 구현할 수 있는 개발자가 되고 싶습니다.

0개의 댓글