데이터베이스 - 2. 데이터 모델링 및 설계

어뮤즈온·2020년 12월 3일
0

정보처리기사

목록 보기
2/3

1. 데이터 모델의 개념

데이터 모델의 정의

  • 현실 세계의 정보들을 컴퓨터에 표현하기 위해 단순화, 추상화하여 체계적으로 표현한 개념적 모형
  • 데이터, 데이터의 관계, 데이터의 의미 및 일관성, 제약조건 등을 기술하기 위한 개념적 도구들의 모임
  • 현실 세계를 데이터베이스에 표현하는 중간 과정, 즉 데이터베이스 설계 과정에서 데이터 구조를 논리적으로 표현하기위해 사용되는 도구
  • 데이터의 구조를 논리적으로 묘사하기 위해 사용되는 지능적 도구

데이터 모델의 종류

1) 개념적 데이터 모델

  • 현실 세계에 대한 인간의 이해를 돕기 위해 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
  • 속성들로 기술된 개체 타입과 개체 타입들 간의 관계를 이용하여 현실 세계를 표현
  • 인간이 이해할 수 있는 정보 구조로 표현하기 때문에 정보 모델이라고도 한다.
  • E-R 모델

2) 논리적 데이터 모델

  • 개념적 모델링 과정에서 얻은 개념적 구조를 컴퓨터가 이해하고 처리할 수 있는 컴퓨터 세계의 환경에 맞도록 변환하는 과정
  • 필드로 기술된 데이터 타이과 데이터 타입들 간의 관계를 이용하여 현실 세계 표현
  • 단순히 데이터 모델이라고 하면 논리적 데이터 모델을 의미
  • 특정 DBMS는 특정 논리적 데이터 모델 하나만 선정하여 사용
  • 관계 모델, 계층 모델, 네트워크 모델

데이터 모델에 표시할 요소

  • 구조(Structure) : 논리적으로 표현된 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질을 표현
  • 연산(Operation) : 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세로서 데이터베이스를 조작하는 기본 도구
  • 제약 조건(Constraint) : 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

데이터 모델의 구성 요소

1) 개체(Entity)

  • 데이터베이스에 표현하려는 것
  • 실세계에서 독립적으로 존재하는 유형, 무형의 정보
  • 어떤 정보를 제공하는 역할 수행
  • 독립적으로 존재하거나 그 자체로서도 구별 가능

2) 속성(Attribute)

  • 데이터의 가장 작은 논리적 단위
  • 개체를 구성하는 항목

3) 관계(Relationship)

  • 개체 간의 관계 또는 속성 간의 관계

2. 개체-관계 모델

개체-관계(Entity-Relationship) 모델의 개요

  • E-R 모델은 개념적 데이터 모델의 가장 대표적인 것(1976년 피터 첸)
  • 개체와 개체 간의 관계를 기본 요소로 이용하여 현실 세계의 무질서한 데이터를 개념적인 논리 데이터로 표현
  • 개체 타입과 이들 간의 관계 타입을 이용해 현실 세계를 개념적으로 표현
  • 개체(Entity), 관계(Relationship), 속성(Attribute)
  • DBMS를 고려한 것은 아니다.

E-R 다이어그램

  • E-R 모델의 기본 아이디어를 시각적으로 표현하기 위한 그림
  • 실체 간의 관계, 조직, 사용자, 프로그램, 데이터 등의 실체들을 표현

3. 관계형 데이터 모델

관계형 데이터 모델의 개념

  • 가장 널리 사용되는 데이터 모델
  • 테이블 내에 있는 속성들 간의 관계를 설정하거나 테이블 간의 관계를 설정
  • 기본키와 이를 참조하는 외래키로 데이터 간의 관계 표현

4. 계층형 데이터 모델

계층형 데이터 모델은 트리 구조를 이용해서 데이터의 상호관계를 계층적으로 정의한 구조

  • 개체 = 레코드 = 세그먼트
  • 연쇄삭제 : 조상 레코드를 삭제하면 모든 자손 레코드도 함께 삭제되는 현상으로 일격 삭제라고도 한다.

5. 망(네트워크)형 데이터 모델

망형 데이터 모델(Network Data Model)의 개요

  • CODASYL이 제한한 것으로, CODASYL DBTG의 모델이라고도 한다.
  • 그래프를 이용해서 데이터 논리 구조 표현
  • 상위와 하위 레코드 사이에서 다 대 다(N:M) 대응 관계를 만족하는 구조
  • 1:1, 1:N, N:M
  • 대표적 DBMS : DBTG, EDBS, TOTAL

망형 데이터 모델의 표현

  • Entity군 : 동종의 Entity 그룹
    ex) 학과, 교수, 학생
  • Entity SET : 주종 관계에 있는 Entity군들의 그룹
  • SET Membership Type : 일 대 다 관계에 연관된 레코드 타입들을 각각 오너(Owner), 멤버(Member)라고 한다.
    -> 오너 : 트리 구조에서 부모와 같은 개념
    ex) 교수에 대한 오너 : 학과
    -> 멤버 : 트리 구조에서 자식과 같은 개념
    ex) 교수에 대한 멤버 : 학생

6. 데이터베이스 설계

데이터베이스 설계의 개념

데이터베이스 설계란 사용자의 요구를 분석하여 그것들을 컴퓨터에 저장할 수 있는 데이터베이스의 구조에 맞게 변경한 후 특정 DBMS로 데이터베이스를 구현하여 일반 사용자들이 사용하게 하는 것

데이터베이스 설계 시 고려사항

  • 무결성 : 삽입, 삭제, 갱신 등의 연산 후에도 저장된 데이터가 정해진 제약 조건을 항상 만족
  • 일관성 : 저장된 데이터들 사이나, 특정 질의에 대한 응답이 처음부터 끝까지 변함없이 일정
  • 회복 : 장애 발생 직전 상태로 복구
  • 보안 : 불법적인 데이터의 노출 또는 변경이나 손실로부터 보호
  • 효율성 : 응답시간의 단축, 시스템의 생산성, 저장 공간의 최적화
  • 데이터베이스 확장 : 지속적으로 데이터 추가

데이터베이스 설계 순서

1) 요구 분석 : 요구 조건 명세서 작성
2) 개념적 설계 : 개념 스키마, 트랜잭션 모델링, E-R 모델
3) 논리적 설계 : 목표 DBMS에 맞는 논리 스키마 설계, 트랜잭션 인터페이스 설계
4) 물리적 설계 : 목표 DBMS에 맞는 물리적 구조의 데이터로 변환
5) 구현 : 목표 DBMS의 DDL로 데이터베이스 생성, 트랜잭션 작성

요구 조건 분석

  • 사용자에 따른 수행 업무와 필요한 데이터의 종류, 용도, 처리 형태, 흐름, 제약 조건 등을 수집
  • 수집된 정보를 바탕으로 요구 조건 명세 작성

개념적 설계 (정보 모델링, 개념화)

  • 정보의 구조를 얻기 위해 현실 세계의 무한성과 계속성 이해
  • 개념 스키마 모델링과 트랜잭션 모델링 병행 수행
  • 요구 조건 명세를 DBMS에 독립적인 E-R 다이어그램(개체 관계도)으로 작성한다.
  • 독립적인 개념 스키마를 설계

논리적 설계 (데이터 모델링)

  • 현실 세계의 자료를 컴퓨터가 이해하고 처리할 수 있는 물리적 저장장치에 저장할 수 있도록 변환하기 위해 특정 DBMS가 지원하는 논리적 자료 구조로 변환시키는 과정
  • 개념 세계의 데이터를 필드로 기술된 데이터 타입과 이 데이터 타입들 간의 관계로 표현되는 논리적 구조의 데이터로 모델화
  • 개념 스키마를 평가 및 정재
  • 트랜잭션의 인터페이스 설계
  • 관계형 데이터베이스라면 테이블 설계하는 단계

물리적 설계(데이터 구조화)

  • 논리적 구조로 표현된 데이터를 디스크 등의 물리적 저장장치에 저장할 수 있는 물리적 구조의 데이터로 변환하는 과정
  • 응용에 대해 처리 성능을 얻기 위해 데이터베이스 파잉ㄹ의 저장 구조 및 엑세스 경로를 결정
  • 저장 레코드의 형식, 순서, 접근 경로와 같은 정보를 사용하여 데이터가 컴퓨터애 저장되는 방법을 묘사
  • 물리적 설계 단계에는 저장 레코드의 양식 설계, 레코드 집중의 분석 및 설계, 접근 경로 설계 등이 꼭 포함되어야 한다.
    -> 저장 레코드의 양식 설계를 할 때 고려해야할 사항 : 데이터 타입, 데이터 값의 분포, 접근 빈도 등
  • 기본적인 데이터 단위는 저장 레코드

** 물리적 설계 시 고려 사항

  • 인덱스의 구조
  • 레코드 크기
  • 파일에 존재하는 레코드 개수
  • 파일에 대한 트랜잭션의 갱신과 참조 성향
  • 성능 향상을 위한 개념 스키마의 변경 여부 검토
  • 빈번한 질의와 트랜잭션들의 수행속도를 높이기 위한 고려
  • 시스템 운용 시 파일 크기의 변화 가능성

**물리적 설계 옵션 선택 시 고려 사항

  • 반응시간 : 트랜잭션 수행을 요구한 시점부터 처리 결과를 얻을때까지의 경과 시간
  • 공간 활용도 : 데이터베이스 파일과 액세스 경로 구조에 의해 사용되는 저장공간의 양
  • 트랜잭션 처리량 : 단위시간 동안 데이터베이스 시스템에 의해 처리될 수 있는 트랜잭션의 평균 개수

데이터베이스 구현

  • 데이터베이스 스키마를 파일로 생성하는 단계
  • DDL을 이용하여 데이터베이스 스키마를 기술한 후 컴파일하여 빈 데이터베이스 파일을 생성
  • 응용 프로그램을 위한 트랜잭션 작성
profile
Hello, world!

0개의 댓글