[sqld] 1. 데이터 모델링의 이해

주·2022년 4월 3일

SQLD sql

SQL개발자자격증

목록 보기

1/4

모델링의 정의
모델링의 정의 : 다양한 현상을 표기법에 의해 표기하는 것
특징 3가지 : 추상화, 단순화, 명확화
관점 3가지 : 데이터 관점, 프로세스 관점, 상관 관점

발생 시점에 따른 엔터티 분류
기본/키엔터티 (Fundamental Entity, Key Entity)

: 해당 업무에 원래 존재하는 정보로, 다른 엔터티와의 관계에 의해 발생 또는 생성되지 않고 독립적으로 존재하는 엔터티. 다른 엔터티의 부모역할을 한다.

중심엔터티 (Main Entity)

: 기본 엔터티로부터 발생되며 업무에 있어서 중심적인 역할을 한다. 다른 엔터티와의 관계를 통해 행위 엔터티를 생성.

행위엔터티 (Active Entity)

: 두 개 이상의 부모엔터티로부터 주로 발생된다. 엔터티의 내용이 자주 바뀌거나 데이터양이 증감한다. 분석 초기 단계보다는 상세 설계단계나 프로세스와 상관모델링을 진행하면서 도출될 수 있다.

데이터 모델링이란
정보시스템을 구축하기 위한 데이터 관점의 업무 분석 기법
현실세계의 데이터(What)에 대해 약속된 표기법에 의해 표현하는 과정
데이터베이스를 구축하기 위한 분석/설계의 과정

데이터 모델링 유의점
중복 (Duplication)
비유연성 (Inflexibility)
비일관성 (Inconsistency)

데이터 모델링 방식
개념적 데이터 모델링

: 추상화 수준이 높고 업무중심적이고 포괄적인 수준의 모델링 진행.

전사적 데이터 모델링, EA수립시 많이 이용.

논리적 데이터 모델링

: 시스템으로 구축하고자 하는 업무에 대해 Key, 속성, 관계 등을 정확하게 표현, 재사용성이 높음.

물리적 데이터 모델링

: 실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계.

데이터베이스 스키마 구조 3단계

스키마란, 데이터베이스 구조와 제약조건에 관해 전반적인 명세를 기술한 것

외부 스키마 (External Schema) = 사용자 뷰(View)

1) 사용자나 응용프로그래머의 입장에서 필요로 하는 논리적 구조를 정의.

2) 서브 스키마라고도 한다.

3) 하나의 데이터베이스 시스템에 여러 개의 외부스키마가 존재 할 수 있으며, 하나의 외부 스키마를 여러 개의 응용프로그램이나 사용자가 공용할 수 있다.

4) 질의어(SQL)을 이용하여 일반사용자가 쉽게 DB를 사용할 수 있다.

개념 스키마 (Conceptual Schema) = 전체적인 뷰(View)

1) 데이터베이스의 전체적인 논리적 구조.

2) 개체간의 관계와 제약조건을 나타내고, 데이터베이스의 접근 권한, 보안 및 무결성 규칙에 관한 명세를 정의한다.

3) 단순히 스키마(Schema)라고 하면 개념 스키마를 의미한다.

4) 기관이나 조직체의 관점에서 데이터베이스를 정의한 것이다.

5) 데이터베이스 관리자(DBA)에 의해서 구성된다.

내부 스키마 (Internal Schema) = 저장 스키마

1) 물리적 저장장치의 입장에서 본 데이터베이스 구조로 물리적인 저장장치와 밀접한 계층.

2) 실제 데이터베이스에 저장될 레코드의 물리적인 구조를 정의하고, 저장될 데이터 항목의 표현방법, 내부 레코드의 물리적 순서 등을 나타낸다.

3) 시스템 프로그래머나 시스템 설계자가 보는 관점의 스키마.

ERD 작성 순서

엔터티를 그린다.
엔터티를 적절하게 배치한다.
엔터티간 관계를 설정한다.
관계명을 기술한다.
관계의 참여도를 기술한다.
관계의 필수여부를 기술한다.

엔터티의 특징
반드시 해당 업무에서 필요하고 관리하고자 하는 정보이어야 한다.

(ex. 환자, 토익의 응시횟수 ...)

유일한 식별자에 의해 식별이 가능해야 한다.
영속적으로 존재하는 인스턴스의 집합이어야 한다. ('한 개'가 아니라 '두 개 이상')
엔터티는 업무 프로세스에 의해 이용되어야 한다.
엔터티는 반드시 속성이 있어야 한다.
엔터티는 다른 엔터티와 최소 한 개 이상의 관계가 있어야 한다.

엔터티, 인스턴스, 속성, 속성값의 관계
한 개의 엔터티는 두 개 이상의 인스턴스의 집합이어야 한다.
한 개의 엔터티는 두 개 이상의 속성을 갖는다.
한 개의 속성은 한 개의 속성값을 갖는다.

속성의 특성에 따른 분류
기본속성 : 업무로부터 추출한 모든 속성
설계속성 : 코드성 데이터, Entity 식별용 일련번호
파생속성 : 다른 속성에 영향을 받아 발생하는 속성, 계산된 값 (합계, 재고, 잔액, 이자)

도메인(Domain)
각 속성은 가질 수 있는 값의 범위가 있는데 이를 그 속성의 도메인(Domain)이라 하며, 엔터티 내에서 속성에 대한 데이터타입과 크기, 그리고 제약사항을 지정하는 것이다.

속성의 명칭 부여
해당 업무에서 사용하는 이름을 부여 한다.
서술식 속성명은 사용하지 않는다.
약어사용은 가급적 제한한다.
전체 데이터모델에서 유일성 확보하는 것이 좋다.

존재/행위에 의한 관계 표현 (ERD & UML)
ERD : 존재/행위에 의한 관계를 구분하지 않는다.
UML : 연관관계와 의존관계를 실선과 점선의 표기법으로 다르게 표기한다.

관계의 표기법
관계명(Membership) : 관계의 이름
관계차수(Cardinality) : 1:1, 1:M, M:N
관계선택사양(Optionality) : 필수관계, 선택관계

관계 체크사항

<두 개의 엔터티 사이에서 관계를 정의할 때 체크해야할 사항>

두 개의 엔터티 사이에 관심 있는 연관 규칙이 존재하는가?
두 개의 엔터티 사이에 정보의 조합이 발생되는가?
업무기술서, 장표에 관계연결을 가능하게 하는 동사(Verb)가 있는가?
업무기술서, 장표에 관계연결에 대한 규칙이 서술되어 있는가?

관계 읽기

기준(Source) 엔터티를 한 개(One) 또는 각(Each)으로 읽는다.
대상(Target) 엔터티의 관계참여도 즉 개수(하나, 하나 이상)를 읽는다.
관계선택사양과 관계명을 읽는다.

식별자의 종류

엔터티 내에서 대표성을 가지는가에 따라 주식별자(Primary Identifier)와 보조식별자(Alternamte Identifier)로 구분
엔터티 내에서 스스로 생성되었는지 여부에 따라 내부식별자와 외부식별자(Foreign Identifier)로 구분
단일 속성으로 식별이 되는가에 따라 단일식별자(Single Identifier)와 복합식별자(Composit Identifier)로 구분
원래 업무적으로 의미가 있던 식별자 속성을 대체하여 일련번호와 같이 새롭게 만든 식별자를 구분하기 위해 본질식별자와 인조식별자로 구분

본질식별자 : 업무에 의해 만들어진 식별자
인조식별자 : 업무적으로 만들어지진 않지만 본질식별자가 복잡한 구성을 갖고 있으므로 인위적으로 만든 식별자

주식별자의 특징

유일성 / 최소성 / 불변성 / 존재성

식별자와 비식별자 관계 비교

주

다음 포스트

[sqld] 1. 데이터 모델링의 이해

SQL개발자자격증

[sqld] 2. 데이터 모델과 성능

0개의 댓글