데이터 정합성 (무결성) Integrity

agnusdei·2025년 5월 17일

Database

목록 보기

37/76

1. 데이터 정합성의 정의

데이터 정합성은 저장된 데이터가 예상된 규칙, 형식, 관계를 일관되게 따르며, 원래의 의미와 목적을 정확히 유지하고 있는 상태입니다.
이는 데이터의 정확성, 일관성, 유효성, 신뢰성을 포함합니다.

2. 정합성의 유형

유형	설명
개체 정합성 (Entity Integrity)	기본키(PK)는 반드시 존재하고, 중복되지 않으며 NULL이 아님
참조 정합성 (Referential Integrity)	외래키(FK)는 참조 대상 테이블의 기본키와 일치하거나 NULL이어야 함
도메인 정합성 (Domain Integrity)	컬럼 값은 정의된 데이터 타입, 길이, 형식, 제약조건을 따라야 함
논리적 정합성 (Logical Integrity)	데이터 간 의미상 논리적 모순이 없어야 함 (예: 입사일 < 퇴사일)
비즈니스 정합성 (Business Rule Integrity)	비즈니스 규칙에 부합해야 함 (예: 나이는 0 이상 120 이하)

3. 데이터 정합성 확보 기법

1) 제약조건 설정 (Constraints)

PK, FK, UNIQUE, NOT NULL, CHECK
DBMS 수준에서 강제 적용 가능

2) 트랜잭션 관리

ACID(Atomicity, Consistency, Isolation, Durability) 보장
롤백/커밋을 통한 일관성 유지

3) 데이터 정제 및 검증

입력값 유효성 검사 (Validation)
중복 제거 및 포맷 통일

4) ETL/데이터 통합 시 품질 규칙 적용

매핑 표준화, 오류값 처리, 유사 레코드 병합 등

5) 로그 및 변경 이력 관리

변경 감사(Audit Trail)
이전 값 추적 가능

4. 데이터 정합성 저해 원인

시스템 간 동기화 실패
데이터 이관/통합 시 매핑 오류
사용자 수동 입력 오류
비정상적인 트랜잭션 종료
프로그램 로직 오류

5. 정합성 관리 체계

구분	내용
기술적 측면	DBMS 제약조건, 트리거, 정합성 검사 스크립트
관리적 측면	데이터 표준화, 품질관리 프로세스, 권한관리
운영적 측면	데이터 변경 승인절차, 로그 모니터링, 백업 정책

6. 사례 및 중요성

금융권: 계좌번호와 사용자 정보 불일치 시 금융 사고 위험
의료정보: 환자 ID 중복 시 진료 오류
공공기관: 주민정보 정합성 부족 시 행정 서비스 오류

정합성은 단순한 기술 이슈가 아니라, 비즈니스 신뢰성과 직접적으로 연결되며, AI/빅데이터 분석의 정확도에도 중대한 영향을 미칩니다.

7. 결론

데이터 정합성은 데이터 기반 의사결정과 시스템 안정성의 필수 전제 조건입니다.
효율적인 정합성 관리를 위해서는 기술적 제약뿐 아니라, 표준화·프로세스·조직적 거버넌스의 통합적 접근이 필요합니다.

agnusdei

DevSecOps, Pentest, Cloud(OpenStack), Develop, Data Engineering, AI-Agent

이전 포스트

기출 DB deduplication

다음 포스트