정규화(Normalization)

문지원(JiwonMoon)·2022년 7월 19일
0
post-thumbnail

정규화(Normalization)란?

데이터 베이스의 정규화란 데이터베이스의 설계를 재구성하는 테크닉이다. 정규화를 통해 불필요한 데이터를 없앨 수 있고 갱신, 삽입, 삭제 시 발생할 수 있는 각종 문제들을 방지할 수 있다.

정규화의 목적은?

기본 목표는 테이블 간에 중복된 데이터를 허용하지 않는 것이다.
중복된 데이터를 허용하지 않아 무결성(Integrity)를 유지할 수 있고, DB의 저장 용량 역시 줄일 수 있다. 이러한 테이블을 분해하는 정규화 단계가 정의되어 있고 단계에 따라 어떻게 분해되는지 달라지게 된다.

정규화를 안했을 때 문제점은?

정규화 되지 않은 구조의 테이블의 중복된 값이 존재할 때 데이터 핸들링 시 다양한 문제가 발생한다.

  1. 갱신(Update) : 중복된 값이 변경될 때 여러 데이터를 갱신해야 한다. 이로인해 데이터 불일치가 발생할 수 있다.

  2. 삽입(Insert) : 중복된 데이터에 데이터를 넣지않는다면 컬럼에는 NULL이 들어갈 것이다.

  3. 삭제(Deletion) : 중복된 데이터가 데이터 삭제를 한다면 해당 데이터의 레코드가 테이블에서 전부 지워져 버린다.

이러한 문제를 해결하기 위해 테이블을 분해하는 정규화 단계가 정의되어 있다.

제 1 정규화

제 1 정규화란 테이블의 컬럼이 원자값(Atomic Value, 하나의 값)을 갖도록 테이블을 분해하는 것이다.

즉, 하나의 컬럼에 하나의 값이 들어도록 분해하는 것이다.
예를들어 하나의 컬럼에 다수의 값이 들어가게 되면 제1정규화를 통해 값을 분해해서 하나의 컬럼당 하나의 값을 갖도록 하는 것이다.

제 2 정규화

제 2 정규화란 제1정규화를 진행한 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분리해하는 것이다.

완전 함수 종속 : 기본키의 부분집합이 결정자가 되어선 안된다는 것

즉, 기본키가 복합키일때 다른 컬럼이 기본키의 부분집합에 의해 결정될 수 있는 상황을 제2정규화를 통해 분리하는 것이다.

제 3 정규화

제 3 정규화란 제 2 정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해하는 것이다.

이행적 종속이라는 것은 A -> B, B -> C가 성립할 때 A -> C가 성립되는 것을 의미한다.

기존의 테이블에서  A는 B을 결정하고 있고, B은 C를 결정하고 있다. 
그렇기 때문에 이를 (A, B (컬럼))테이블과 (B, C(컬럼)) 테이블로 분해해야 한다. 
이행적 종속을 제거하는 이유는 비교적 간단하다. 예를 들어  B 컬럼이 D 컬럼으로 변경되었을 때 이행적 종속이 존재한다면 B->D 가 되었더라도 C 컬럼은 B 컬럼에 따라 결정된다. 물론 강좌 D컬럼에 맞게 C컬럼을 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제3 정규화를 하는 것이다.

BCNF 정규화

BCNF 정규화란 제 3 정규화를 진행한 테이블에 대해 모든 결정자가 후보키가 되도록 테이블을 분해하는 것이다.


References (참고 자료)

0개의 댓글