구조
/ 연산
/ 제약조건
요구조건 분석 → 개념적 설계 → 논리적 설계 → 물리적 설계 📌
1.요구조건 분석
2.개념적 설계(또는 개념적 데이터 모델)
추상적
, 개념적
으로 표현순서 | 이름 | 형태 | 키 | 관계 |
---|---|---|---|---|
1 | 관계 데이터 모델링 | 2차원 테이블 형태로 구성된 모델 | 기본 키(PK)와 이를 참조하는 외래 키(FK) 로 관계 표현 | 1:1 / 1:N / N:M 관계 자유롭게 표현 |
2 | 계층 데이터 모델링 | 트리 형태로 구성된 모델 | - | 1:N 관계만 허용 |
3 | 네트워크 데이터 모델링 | 그래프 형태로 구성된 모델 | - | N:M 관계만 허용 |
성능
, 물리적 데이터
라는 단어가 나오면 물리적 모델이라 보기행과 열
로 구성된 테이블 형태
로 구성하는 데이터 모델관계형 데이터베이스에서 원하는 정보와 그 정보를 어떻게
유도하는가를 기술하며 절차적 정형 언어
합집합
/ 교집합
/ 차집합
/ 카디널 프로덕트
셀렉트
/ 프로젝트
/ 조인
/ 디비전
비절차적 언어
무엇
이라는 것만 선언)릴레이션 조작 시, 데이터들이 불필요하게 중복되어 예기치 못한 상황이 발생하는 현상
이상현상의 종류 :
삽입 이상
/삭제 이상
/갱신 이상
(조회를 제외한 나머지에 이상이 생긴 경우를 의미함)
관계형 데이터 모델에서 데이터의 중복성을 제거
하여 이상현상을 방지하고
데이터의 일관성과 정확성을 유지하기 위하여 데이터 무손실
분해 과정
1차 정규화
2차 정규화
3차 정규화
보이스-코드 정규화
4차 정규화
5차 정규화
✅ 정규화 단계
- 각 단계의 고유 특징을 잘 기억해두며
제 2정규화
부터는 테이블을 쪼개는 것- 보통 현업에서는
3 정규화
까지 진행하며, 특정 분야에서는 5정규화까지 진행하기도 함
비정규화
, 역정규화
라고도 불림릴레이션과 릴레이션 사이에 대해 참조의 일관성을 보장하기 위한 조건
검색 연산의 최적화를 위해 데이터베이스 내 열에 대한 정보를 구성한 데이터구조
10 ~ 15%
이내대용량의 테이블을 파티션이라는 보다 작은 논리적인 단위로 나누어 성능 저하 방지 및 관리
를 상대적으로 보다 용이하게 하고자 하는 기법
레인지 파티셔닝
/ 해시 파티셔닝
/ 리스트 파티셔닝
/ 컴포지트 파티셔닝
연속적인 숫자나 날짜를 기준
으로 하는 파티셔닝 기법해시 파티셔닝(Hash partitioning)
해시 함수 값
에 의한 파티셔닝 기법리스트 파티셔닝(List partitioning)
컴포지트 파티셔닝(Composite partitioning)
범위분할에 이후 해시 함수를 적용
하여 재분할 하는 파티셔닝 기법개념
: 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합
정의
순서 | 이름 | 특징 |
---|---|---|
1 | 통합된 데이터 | 자료의 중복을 배제한 데이터의 모임 |
2 | 저장된 데이터 | 저장 매체에 저장된 데이터 |
3 | 운영 데이터 | 조직 업무 수행에 필요한 데이터 |
4 | 공용 데이터 | 여러 Application, 시스템들이 공동으로 사용하는 데이터 |
특성
: 실시간 접근성 / 계속적인 변화 / 동시 공용 / 내용 참조종류
: File System / RDBMS(관계형) / HDBMS(계층형) / NDBMS(네트워크형)특징
: 데이터 무결성, 일관성, 회복성, 보안성, 효율성시스템, 서비스 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트(PB) 크기의 비정형데이터
(+ 정형 데이터 + 반정형 데이터)
전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어
DBMS의 유형 및 특징과 동일
대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
분류 규칙
: 과거 데이터로부터 특성
을 찾아내 분류 모형을 만들어 레코드 결과 값 예측
연관 규칙
: 다양한 데이터 내 항목들 간 종속관계
를 찾아내는 기법연속규칙
: 연관 규칙
+ 시간 관련 정보데이터 군집화
: 유사한 특성을 지닌 몇 개의 소그룹으로 분할