데이터베이스 정규화는 데이터베이스의 설계와 관련 있다. 데이터베이스 설계에 따라 데이터가 어떻게 저장될 지 그 구조를 결정하기 때문이다.
데이터 중복(data redundancy)은 실제 데이터의 동일한 복사본이나, 부분적인 복사본을 뜻한다.
물론 이러한 중복으로 데이터를 복구할 때에 더 수월할 수도 있다. 그러나 대체로 데이터베이스 내에서는 몇가지 문제점을 지닌다.
데이터 정규화는 데이터 무결성을 강화하는 목적도 지닌다.
데이터 무결성(data integrity)은 데이터의 수명 주기 동안 정확성과 일관성을 유지하는 것을 뜻한다.
다시 말해 입력된 데이터가 오염되지 않고, 입력된 그대로 데이터를 사용할 수 있다는 뜻이다.
데이터 이상 현상(anomaly)은 기대한 데이터와 다른, 이상 현상을 가리킨다.
다음과 같은 3가지 현상이 있다.
갱신 이상(update anomaly)은 여러 행(레코드)에 걸쳐 동일한 데이터가 있을 때, 어떤 행을 갱신해야 하는지 논리적인 일관성이 없는 경우 발생한다.
삽입 이상(insertion anomaly)은 데이터를 삽입하지 못하는 경우를 가리킨다.
삭제 이상(deletion anomaly)은 데이터의 특정 부분을 지울 때 의도치 않게 다른 부분도 함께 지우는, 이상 현상이다.