[Database]정규화(Nomalization)

윤재열·2022년 5월 8일
0

CS지식

목록 보기
8/16

DB 설계 중에 어떻게 하면 잘 설계 할 수 있을까 해서 공부해 보았습니다.

1. 정규화(Normalization)

  • 정규화의 기본 목표는 테이블 간의 중복된 데이터를 허용하지 않는다는 것입니다.
  • 중복된 데이터를 허용하지 않음으로써 무결성(Integrity)를 유지할 수 있으며, DB의 저장 용량 역시 줄일 수 있습니다.
  • 이러한 테이블을 분해하는 정규화 단계가 정의되어 있는데, 여기서 테이블을 어떻게 분해되는지에 따라 정규화 단계가 달라지는데, 각각의 정규화 단계에 대해 공부해 봅니다.

제 1 정규화

  • 제 1 정규화란 테이블의 칼럼이 원자값(Atomic Value,하나의 값)을 갖도록 테이블을 분해하는 것입니다.
  • 예를 들어 아래와 같은 고객 취미 테이블이 존재한다고 가정합니다.
이름취미들
윤재열코딩
최성진영화,음악
김가연음악,쇼핑
김승필음악
김영한게임

위의 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제 1정규형을 만족하지 못하고 있습니다.
그렇기 때문에 이를 제 1정규화하여 분해할 수 있습니다.

  • 제 1 정규화를 진행한다면
이름취미
윤재열코딩
최성진영화
최성진음악
김가연음악
김가연쇼핑
김승필음악
김영한게임

제 2 정규화

  • 제 2 정규화란 제 1 정규화를 진행한 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분해하는 것입니다.
  • 여기서 완전 함수 종속이라는 것은 기본키의 부분집합이 결정자가 되어서는 안된다는 것입니다.
  • 예를 들어 아래와 같은 수강 강좌 테이블을 살펴 봅니다.
    • 수강 강좌
      학생번호강좌이름강의실성적
      501데이터베이스공학관 1103.5
      401데이터베이스공학관 1104.0
      402알고리즘공학관 1083.5
      502자료구조공학관 1114.0
      501자료구조공학관 1113.5

  • 이 테이블에서 기본키는 (학생번호,강좌이름)으로 복합키 입니다.

  • 그리고 (학생번호,강좌이름)인 기본키는 성적을 결정합니다.

  • (학생번호,강좌이름) -> (성적)

  • 그런데 여기서 강의실이라는 칼럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있습니다.

  • (강좌이름) -> (강의실)

  • 즉, 기본키(학생번호,강좌이름)의 부분키인 강좌이름이 결정자이기 때문에 위의 테이블의 경우 다음과 같이 기존의 테이블에서 강의실을 분해하여 별도의 테이블로 관리하여 제 2 정규형을 만족시킬 수 있습니다.

    • 수강
      학생번호강좌이름성적
      501데이터베이스3.5
      401데이터베이스4.0
      402알고리즘3.5
      502자료구조4.0
      501자료구조3.5
    • 강의실
      강좌이름강의실
      데이터베이스공학관 110
      알고리즘공학관 108
      자료구조공학관 111

제 3 정규화

  • 제 3 정규화란 제 2 정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해하는 것입니다.

  • 여기서 이행적 종속이라는 것은 A->B, B->C 가 성립할 때 A->C 가 성립되는 것을 의미합니다.

  • 예를 들어 아래와 같은 계절 학기 테이블이 있다고 가정합니다.

    • 계절학기
      학생번호강좌이름수강료
      501데이터베이스20000
      401데이터베이스20000
      402알고리즘15000
      502자료구조25000
  • 기존의 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있습니다.

  • 그렇기 때문에 이를 (학생번호,강좌이름) 테이블과 (강좌이름,수강료) 테이블로 분해해야합니다.

  • 이행적 종속을 제거하는 이유는 간단합니다.

  • 예를들어 501번 학생이 수강하는 강좌가 알고리즘으로 변경했다고 가정해봅니다.

  • 이행적 종속이 존재한다면 501번 학생은 알고리즘이라는 수업을 20000원이라는 수강료로 듣게 됩니다.

  • 물론 강좌 이름에 맞게 수강료를 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제 3 정규화를 하는 것입니다.

  • 즉, 학생 번호를 통해 강좌 이름을 참조하고, 강좌 이름으로 수강료를 참조하도록 테이블을 분해해야 하며 그 결과는 다음의 그림과 같습니다.

    • 계절수강

      학생번호강좌이름
      501데이터베이스
      401데이터베이스
      402알고리즘
      502자료구조
    • 수강료

      강좌이름수강료
      데이터베이스20000
      알고리즘15000
      자료구조25000

BCNF 정규화

  • BCNF 정규화란 제 3 정규화를 진행한 테이블에 대해 모든 결정자가 후보키가 되도록 테이블을 분해하는것입니다.

  • 예를들어 다음과 같은 특강수강 테이블이 존재한다고 가정합니다.

    • 특강수강
      학생번호특강이름교수
      501소셜네트워크김교수
      401소셜네트워크김교수
      402인강과 동물승교수
      502창업전략박교수
      502창업전략홍교수

  • 특강수강 테이블에서 기본키는 (학생번호,특강이름)입니다.

  • 그리고 기본키는 교수를 결정합니다. 또한 여기서 교수는 특강이름을 결정하고 있습니다.

  • 그런데 문제는 교수가 특강이름을 결정하는 결정자이지만, 후보키가 아니라는 점이다.

  • 그렇기 때문에 BCNF 정규화를 만족시키기 위해서 위의 테이블을 분해해야 합니다.

  • 다음과 같이 특강신청 테이블과 특강교수 테이블로 분해할 수 있습니다.

    • 특강신청
      학생번호특강이름
      501소셜네트워크
      401소셜네트워크
      402인강과 동물
      502창업전략
      502창업전략
    • 특강교수
      특강이름교수
      소셜네트워크김교수
      소셜네트워크김교수
      인강과 동물승교수
      창업전략박교수
      창업전략홍교수
profile
블로그 이전합니다! https://jyyoun1022.tistory.com/

0개의 댓글