DBMS
스키마
데이터베이스의 구조와 제약조건에 관한 전반적인 명세를 기술한 것
종류 | 내용 |
---|---|
외부 스키마 | 사용자나 응용 프로그래머가 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의한 것 |
개념 스키마 | 데이터베이스의 전체적인 논리적 구조, 하나만 존재 |
내부 스키마 | 물리적 저장장치의 입장에서 본 데이터베이스 구조 |
데이터베이스 설계 순서
요구조건 분석
- 개념적 설계
- 논리적 설계
- 물리적 설계
- 구현
개념적 설계
논리적 설계
물리적 설계
데이터 모델
현실 세계의 정보들을 컴퓨터에 표현하기 위해서 단순화, 추상화하여 체계적으로 표현한 개념적 모형
요소 | 내용 |
---|---|
구조 | 논리적으로 표현된 개체 타입들 간의 관계 |
연산 | 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세 |
제약 조건 | 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건 |
E-R 다이어그램
기호 | 의미 |
---|---|
사각형 | 개체 타입 |
마름모 | 관계 타입 |
타원 | 속성 |
이중 타원 | 다중 값 속성 |
밑줄 타원 | 기본키 속성 |
복수 타원 | 복합 속성 |
관계 | 1:1 등의 개체 간 관계에 대한 대응 수를 선 위에 표시 |
선, 링크 | 개체 타입과 속성을 연결 |
관계형 데이터베이스의 릴레이션 구조
릴레이션
: 데이터들을 표의 형태로 표현한 것으로, 구조를 나타내는 릴레이션 스키마와 실제 값들인 릴레이션 인스턴스로 구성릴레이션 인스턴스
: 데이터 개체를 구성하고 있는 속성들에 데이터 타입이 정의되어 구체적인 데이터 값을 가진 것튜플
카디널리티
또는 기수
, 대응수
라고 함속성
디그리
또는 차수
라고 함도메인
후보키
릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합
기본키로 사용할 수 있는 속성들
유일성과 최소성을 모두 만족시켜야 함
유일성 | 하나의 키 값으로 하나의 튜플만을 유일하게 식별할 수 있어야 한다 |
최소성 | 키를 구성하는 속성 하나를 제거하면 유일하게 식별할 수 없도록 꼭 필요한 최소의 속성으로 구성되어야 한다 |
기본키(PK)
대체키(보조키)
슈퍼키
외래키(FK)
무결성
데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실 세계의 실제값이 일치하는 정확성
개체 무결성 | 기본 테이블의 기본키를 구성하는 어떤 속성도 Null 값이나 중복값을 가질 수 없다 |
참조 무결성 | 릴레이션은 참조할 수 없는 외래키 값을 가질 수 없다 |
관계 대수
순수 관계 연산자
이름 | 설명 | 기호 |
---|---|---|
Select(수평 연산) | 릴레이션에 존재하는 튜플 중에서 선택 조건을 만족하는 튜플의 부분집합을 구하여 새로운 릴레이션을 만드는 연산 | σ |
Project(수직 연산자) | 주어진 릴레이션에서 속성 리스트에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산 | π |
Join | 공통 속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산 | ⋈ |
Division | Y가 X의 부분집합인 두 개의 릴레이션 R(X)와 S(Y)가 있을 때, R의 속성이 S의 속성값을 모두 가진 튜플에서 S가 가진 속성을 제외한 속성만을 구하는 연산 | ÷ |
일반 집합 연산자
이름 | 설명 | 기호 |
---|---|---|
Union(합집합) | 두 릴레이션에 존재하는 튜플의 합집합을 구하되, 결과로 생성된 릴레이션에서 중복되는 튜플은 제거되는 연산 | ∪ |
Intersection(교집합) | 두 릴레이션에 존재하는 튜플의 교집합을 구하는 연산 | ∩ |
Difference(차집합) | 두 릴레이션에 존재하는 튜플의 차집합을 구하는 연산 | - |
Cartesian Product(교차곱) | 두 릴레이션에 있는 튜플들의 순서쌍을 구하는 연산, 교차곱의 디그리는 두 릴레이션의 디그리를 더한 것과 같고, 카디널리티는 두 릴레이션의 카디널리티를 곱한 것과 같음 | x |
관계해석
이상(Anomaly)
데이터베이스 내에 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 않게 발생하는 곤란한 현상
삽입 이상 | 의도와는 상관없이 원하지 않은 값들로 인해 테이블에 데이터를 삽입할 수 없게 되는 현상 |
삭제 이상 | 테이블에서 튜플을 삭제할 때 의도와는 상관없는 값들이 연쇄 삭제되는 현상 |
갱신 이상 | 테이블에서 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성이 생기는 현상 |
함수적 종속
함수적 종속(Functional Dependency) | 속성 X의 값 각각에 대해 항상 속성 Y의 값이 오직 하나만 연관되어있을 때 Y는 X에 함수적 종속된다고 함, X → Y |
완전 함수적 종속(Full ") | 속성 집합 X 전체에 대해 함수적 종속이면서 X의 다른 진부분 집합 중 어떤 집합에도 함수적 종속이 아닐 때를 말함 |
부분 함수적 종속(Partial ") | 완전 함수적 종속과 다르게 전체에 종속이면서 일부에도 함수적 종속일 때를 말함 |
이행적 함수적 종속(Transitive ") | X → Y 이고, Y → Z일 때, X → Z를 만족하는 관계 |
정규화
정규화 과정
제 1 정규형
: 테이블의 모든 속성 값이 원자 값으로만 되어 있는 정규형제 2 정규형
: 테이블이 제 1 정규형이고, 기본키가 아닌 모든 속성이 기본키에 대하여 완전 함수적 종속을 만족하는 정규형제 3 정규형
: 테이블이 제 2 정규형이고, 기본키가 아닌 모든 속성이 기본키에 대해 이행적 함수적 종속을 만족하지 않는 정규형BCNF
: 테이블에서 모든 결정자가 후보키인 정규형, 제 3 정규형에 후보키가 여러 개 존재하고, 이러한 후보키들이 서로 중첩되어 나타나는 경우에 적용 가능제 4 정규형
: 테이블에 다중 값 종속
A →→ B가 존재할 경우 테이블의 모든 속성이 A에 함수적 종속 관계를 만족하는 정규형제 5 정규형
: 테이블의 모든 조인 종속
이 테이블의 후보키를 통해서만 성립되는 정규형💡
다중 값 종속(다치 종속)
A, B, C 3개의 속성을 가진 테이블 R에서 어떤 복합 속성(A, C)에 대응하는 B 값의 집합이 A 값에만 종속되고 C 값에는 무관하면, B는 A에 다중 값 종속이라 함
💡
조인 종속
어떤 테이블 R의 속성에 대한 부분 집합 X, Y, ..., Z가 있을 때 만약 테이블 R이 자신의 프로젝션 X, Y, ..., Z를 모두 조인한 결과와 동일한 경우 테이블 R은 조인 종속 JD(X, Y, ..., Z)를 만족한다고 함
정규화 과정 정리(도부이결다조)
비정규 릴레이션
→ 1NF
→ 2NF
→ 3NF
→ BCNF
→ 4NF
→ 5NF
도
메인이 원자값 → 부
분적 함수 종속 제거 → 이
행적 함수 종속 제거 → 결
정자이면서 후보키가 아닌 것 제거 → 다
치 종속 제거 → 조
인 종속성 이용
반정규화
중복 테이블 추가
시스템 카탈로그
트랜잭션
트랜잭션의 특성(원일독영)
특성 | 의미 |
---|---|
원자성 | 트랜잭션의 연산은 데이터베이스에 모두 반영되도록 완료되든지 아니면 복구되어야 함 |
일관성 | 트랜잭션이 그 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 변환함 |
독립성, 격리성, 순차성 | 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행 중에 다른 트랜잭션의 연산이 끼어들 수 없음 |
영속성, 지속성 | 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라도 영구적으로 반영되어야 함 |
CRUD 분석
인덱스