1. 데이터 모델의 개념
데이터 모델의 정의
- 현실 세계의 정보들을 컴퓨터에 표현하기 위해 단순화, 추상화하여 체계적으로 표현한 개념적 모형
- 데이터, 데이터의 관계, 데이터의 의미 및 일관성, 제약조건 등을 기술하기 위한 개념적 도구들의 모임
- 현실 세계를 데이터베이스에 표현하는 중간 과정, 즉 데이터베이스 설계 과정에서 데이터 구조를 논리적으로 표현하기위해 사용되는 도구
- 데이터의 구조를 논리적으로 묘사하기 위해 사용되는 지능적 도구
데이터 모델의 종류
1) 개념적 데이터 모델
- 현실 세계에 대한 인간의 이해를 돕기 위해 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
- 속성들로 기술된 개체 타입과 개체 타입들 간의 관계를 이용하여 현실 세계를 표현
- 인간이 이해할 수 있는 정보 구조로 표현하기 때문에 정보 모델이라고도 한다.
- E-R 모델
2) 논리적 데이터 모델
- 개념적 모델링 과정에서 얻은 개념적 구조를 컴퓨터가 이해하고 처리할 수 있는 컴퓨터 세계의 환경에 맞도록 변환하는 과정
- 필드로 기술된 데이터 타이과 데이터 타입들 간의 관계를 이용하여 현실 세계 표현
- 단순히 데이터 모델이라고 하면 논리적 데이터 모델을 의미
- 특정 DBMS는 특정 논리적 데이터 모델 하나만 선정하여 사용
- 관계 모델, 계층 모델, 네트워크 모델
데이터 모델에 표시할 요소
- 구조(Structure) : 논리적으로 표현된 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질을 표현
- 연산(Operation) : 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세로서 데이터베이스를 조작하는 기본 도구
- 제약 조건(Constraint) : 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건
데이터 모델의 구성 요소
1) 개체(Entity)
- 데이터베이스에 표현하려는 것
- 실세계에서 독립적으로 존재하는 유형, 무형의 정보
- 어떤 정보를 제공하는 역할 수행
- 독립적으로 존재하거나 그 자체로서도 구별 가능
2) 속성(Attribute)
- 데이터의 가장 작은 논리적 단위
- 개체를 구성하는 항목
3) 관계(Relationship)
2. 개체-관계 모델
개체-관계(Entity-Relationship) 모델의 개요
- E-R 모델은 개념적 데이터 모델의 가장 대표적인 것(1976년 피터 첸)
- 개체와 개체 간의 관계를 기본 요소로 이용하여 현실 세계의 무질서한 데이터를 개념적인 논리 데이터로 표현
- 개체 타입과 이들 간의 관계 타입을 이용해 현실 세계를 개념적으로 표현
- 개체(Entity), 관계(Relationship), 속성(Attribute)
- DBMS를 고려한 것은 아니다.
E-R 다이어그램
- E-R 모델의 기본 아이디어를 시각적으로 표현하기 위한 그림
- 실체 간의 관계, 조직, 사용자, 프로그램, 데이터 등의 실체들을 표현
3. 관계형 데이터 모델
관계형 데이터 모델의 개념
- 가장 널리 사용되는 데이터 모델
- 테이블 내에 있는 속성들 간의 관계를 설정하거나 테이블 간의 관계를 설정
- 기본키와 이를 참조하는 외래키로 데이터 간의 관계 표현
4. 계층형 데이터 모델
계층형 데이터 모델은 트리 구조를 이용해서 데이터의 상호관계를 계층적으로 정의한 구조
- 개체 = 레코드 = 세그먼트
- 연쇄삭제 : 조상 레코드를 삭제하면 모든 자손 레코드도 함께 삭제되는 현상으로 일격 삭제라고도 한다.
5. 망(네트워크)형 데이터 모델
망형 데이터 모델(Network Data Model)의 개요
- CODASYL이 제한한 것으로, CODASYL DBTG의 모델이라고도 한다.
- 그래프를 이용해서 데이터 논리 구조 표현
- 상위와 하위 레코드 사이에서 다 대 다(N:M) 대응 관계를 만족하는 구조
- 1:1, 1:N, N:M
- 대표적 DBMS : DBTG, EDBS, TOTAL
망형 데이터 모델의 표현
- Entity군 : 동종의 Entity 그룹
ex) 학과, 교수, 학생
- Entity SET : 주종 관계에 있는 Entity군들의 그룹
- SET Membership Type : 일 대 다 관계에 연관된 레코드 타입들을 각각 오너(Owner), 멤버(Member)라고 한다.
-> 오너 : 트리 구조에서 부모와 같은 개념
ex) 교수에 대한 오너 : 학과
-> 멤버 : 트리 구조에서 자식과 같은 개념
ex) 교수에 대한 멤버 : 학생
6. 데이터베이스 설계
데이터베이스 설계의 개념
데이터베이스 설계란 사용자의 요구를 분석하여 그것들을 컴퓨터에 저장할 수 있는 데이터베이스의 구조에 맞게 변경한 후 특정 DBMS로 데이터베이스를 구현하여 일반 사용자들이 사용하게 하는 것
데이터베이스 설계 시 고려사항
- 무결성 : 삽입, 삭제, 갱신 등의 연산 후에도 저장된 데이터가 정해진 제약 조건을 항상 만족
- 일관성 : 저장된 데이터들 사이나, 특정 질의에 대한 응답이 처음부터 끝까지 변함없이 일정
- 회복 : 장애 발생 직전 상태로 복구
- 보안 : 불법적인 데이터의 노출 또는 변경이나 손실로부터 보호
- 효율성 : 응답시간의 단축, 시스템의 생산성, 저장 공간의 최적화
- 데이터베이스 확장 : 지속적으로 데이터 추가
데이터베이스 설계 순서
1) 요구 분석 : 요구 조건 명세서 작성
2) 개념적 설계 : 개념 스키마, 트랜잭션 모델링, E-R 모델
3) 논리적 설계 : 목표 DBMS에 맞는 논리 스키마 설계, 트랜잭션 인터페이스 설계
4) 물리적 설계 : 목표 DBMS에 맞는 물리적 구조의 데이터로 변환
5) 구현 : 목표 DBMS의 DDL로 데이터베이스 생성, 트랜잭션 작성
요구 조건 분석
- 사용자에 따른 수행 업무와 필요한 데이터의 종류, 용도, 처리 형태, 흐름, 제약 조건 등을 수집
- 수집된 정보를 바탕으로 요구 조건 명세 작성
개념적 설계 (정보 모델링, 개념화)
- 정보의 구조를 얻기 위해 현실 세계의 무한성과 계속성 이해
- 개념 스키마 모델링과 트랜잭션 모델링 병행 수행
- 요구 조건 명세를 DBMS에 독립적인 E-R 다이어그램(개체 관계도)으로 작성한다.
- 독립적인 개념 스키마를 설계
논리적 설계 (데이터 모델링)
- 현실 세계의 자료를 컴퓨터가 이해하고 처리할 수 있는 물리적 저장장치에 저장할 수 있도록 변환하기 위해 특정 DBMS가 지원하는 논리적 자료 구조로 변환시키는 과정
- 개념 세계의 데이터를 필드로 기술된 데이터 타입과 이 데이터 타입들 간의 관계로 표현되는 논리적 구조의 데이터로 모델화
- 개념 스키마를 평가 및 정재
- 트랜잭션의 인터페이스 설계
- 관계형 데이터베이스라면 테이블 설계하는 단계
물리적 설계(데이터 구조화)
- 논리적 구조로 표현된 데이터를 디스크 등의 물리적 저장장치에 저장할 수 있는 물리적 구조의 데이터로 변환하는 과정
- 응용에 대해 처리 성능을 얻기 위해 데이터베이스 파잉ㄹ의 저장 구조 및 엑세스 경로를 결정
- 저장 레코드의 형식, 순서, 접근 경로와 같은 정보를 사용하여 데이터가 컴퓨터애 저장되는 방법을 묘사
- 물리적 설계 단계에는 저장 레코드의 양식 설계, 레코드 집중의 분석 및 설계, 접근 경로 설계 등이 꼭 포함되어야 한다.
-> 저장 레코드의 양식 설계를 할 때 고려해야할 사항 : 데이터 타입, 데이터 값의 분포, 접근 빈도 등
- 기본적인 데이터 단위는 저장 레코드
** 물리적 설계 시 고려 사항
- 인덱스의 구조
- 레코드 크기
- 파일에 존재하는 레코드 개수
- 파일에 대한 트랜잭션의 갱신과 참조 성향
- 성능 향상을 위한 개념 스키마의 변경 여부 검토
- 빈번한 질의와 트랜잭션들의 수행속도를 높이기 위한 고려
- 시스템 운용 시 파일 크기의 변화 가능성
**물리적 설계 옵션 선택 시 고려 사항
- 반응시간 : 트랜잭션 수행을 요구한 시점부터 처리 결과를 얻을때까지의 경과 시간
- 공간 활용도 : 데이터베이스 파일과 액세스 경로 구조에 의해 사용되는 저장공간의 양
- 트랜잭션 처리량 : 단위시간 동안 데이터베이스 시스템에 의해 처리될 수 있는 트랜잭션의 평균 개수
데이터베이스 구현
- 데이터베이스 스키마를 파일로 생성하는 단계
- DDL을 이용하여 데이터베이스 스키마를 기술한 후 컴파일하여 빈 데이터베이스 파일을 생성
- 응용 프로그램을 위한 트랜잭션 작성