[DB] 정규화(Normalization)

giggle·2023년 8월 14일
0

📌 정규화(Normalization)란?

데이터베이스 설계 과정에서 중복을 최소화하고 데이터의 일관성과 무결성을 유지하기 위해 데이터를 구조화하는 프로세스입니다.

정규화는 데이터를 논리적으로 그룹화하여 테이블을 생성하고, 각 테이블 간의 관계를 정의하여 데이터 중복과 이상을 줄이는데 목적이 있습니다.

정규화는 주로 관계형 데이터베이스에서 사용되며, 관계형 데이터베이스의 성능, 일관성, 유지보수 등을 향상시키기 위해 필요합니다.

목적

  • 데이터의 중복을 없애면서 불필요한 데이터를 최소화시킨다.
  • 무결성을 지키고, 이상 현상을 방지한다.
  • 테이블 구성을 논리적이고 직관적으로 할 수 있다.
  • 데이터베이스 구조를 확장에 용이해진다.

📌 제 1정규화(1NF)

제1 정규화란 테이블의 컬럼이 원자값(Atomic Value, 하나의 값)을 갖도록 테이블을 분해하는 것입니다.

조건

  • 어떤 릴레이션에 속한 모든 도메인이 원자값만으로 되어 있어야합니다.
  • 모든 속성에 반복되는 그룹이 나타나지 않습니다.
  • 기본키를 사용하여 관련 데이터의 각 집합을 고유하게 식별할 수 있어야 합니다.

위의 테이블에서는 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제1 정규형을 만족하지 못하고 있습니다. 그렇기 때문에 이를 제1 정규화하여 분해할 수 있고, 아래 테이블과 같이 표현알 수 있습니다.

📌 제 2정규화(2NF)

제2 정규화란 제1 정규화를 진행한 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분해하는 것입니다. 여기서 완전 함수 종속이라는 것은 기본키의 부분집합이 결정자가 되어선 안된다는 것을 의미합니다.

테이블에서 기본키가 복합키(키1, 키2)로 묶여있을 때, 두 키 중 하나의 키만으로 다른 컬럼을 결정지을 수 있으면 안됩니다.

이 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키입니다. 그리고 (학생번호, 강좌이름)인 기본키는 성적을 결정하고 있습니다. (학생번호, 강좌이름) --> (성적)

그런데 여기서 강의실이라는 컬럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있습니다. (강좌이름) --> (강의실)

즉, 기본키(학생번호, 강좌이름)의 부분키인 강좌이름이 결정자이기 때문에 위의 테이블의 경우 다음과 같이 기존의 테이블에서 강의실을 분해하여 별도의 테이블로 관리하여 제2 정규형을 만족시킬 수 있습니다.

📌 제 3정규화(3NF)

제3 정규화란 제2 정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해하는 것입니다. 여기서 이행적 종속이라는 것은 A -> B, B -> C가 성립할 때 A -> C가 성립되는 것을 의미합니다.

기존의 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있습니다. 그렇기 때문에 이를 (학생 번호, 강좌 이름) 테이블과 (강좌 이름, 수강료) 테이블로 분해해야 합니다.

이행적 종속을 제거하는 이유는 비교적 간단합니다. 예를 들어 501번 학생이 수강하는 강좌가 스포츠경영학으로 변경되었다고 가정하고, 이행적 종속이 존재한다면 501번의 학생은 스포츠경영학이라는 수업을 20000원이라는 수강료로 듣게 됩니다.

물론 강좌 이름에 맞게 수강료를 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제3 정규화를 하는 것입니다.

즉, 학생 번호를 통해 강좌 이름을 참조하고, 강좌 이름으로 수강료를 참조하도록 테이블을 분해해야 하며 그 결과는 다음의 그림과 같습니다.


참고


피드백 및 개선점은 댓글을 통해 알려주세요😊

profile
배움을 글로 기록하는 개발자가 되겠습니다.

0개의 댓글