1. 물리 데이터 모델 설계
물리 데이터 저장소 구성
데이터 제약조건 설계
- 참조무결성 제약조건
릴레이션 사이에 대해 참조의 일관성을 보장하기 위한 조건이다.
- 제한: 참조무결성의 원칙을 위배하는 연산을 거절하는 옵션
- 연쇄: 참조되는 릴레이션에서 튜플을 삭제하고, 참조되는 릴레이션에서 이 튜플을 참조하는 튜플도 함께 삭제하는 옵션이다.
- 널 값: 참조되는 릴레이션에서 튜플을 삭제하고, 참조하는 릴레이션에서 해당 튜플을 외래키에 NULL 값을 넣는 옵션
파티션 설계
- 레인지 파티셔닝: 연속적인 숫자나 날짜를 기준으로 하는 파티셔닝 기법
- 해시 파티셔닝: 파티션 키의 해시 함수값에 의한 파티셔닝 기법
- 리스트 파티셔닝: 명시적 제어가 가능한 파티셔닝 기법
- 컴포지트 파티셔닝: 2개 이상의 파티셔닝을 결합하는 기법
레해리컴
파티션의 장점
성능 향상
가용성 향상
백업 가능
경합 감소
성가백경
2. 데이터베이스 기초 활용하기
데이터베이스 종류
데이터베이스 개념
다수의 사용자가 사용할 목적으로 통합하여 관리되는 데이터의 집합이다
- 관계형 데이터베이스 관리시스템(RDBMS)
: 관계형 모델을 기반으로 하는 가장 보편화된 데이터베이스 관리 시스템
- 계층형 데이터베이스 관리시스템(HDBMS)
: 상하 종속적인 관계로 계층화되어 관리하는 데이터베이스이다.
DBMS
개념
데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업 등의 기능을 지원하는 소프트웨어
유형
키-값 DBMS: 키 값 제공, 메모리 기반에서 성능 우선 시스템 기능 제공 DBMS
컬럼 기반 데이터 저장: (column,Value) 조합으로 된 여러개의 필드를 갖는 DBMS
문서 저장 DBMS: 값의 데이터 타입이 문서인 DBMS
그래프 DBMS: 시멘틱 웹과 온톨로지 분야에서 사용되는 그래프로 데이터를 표현하는 DBMS
키컬문그
특징
- 데이터 무결성: 부적절한 자료가 입력되어도 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질(중복x,누락x,일관성o)
- 데이터 일관성: 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터 값이 변함없이 일정
- 데이터 회복성: 장애가 발생하면 특정 상태로 복구되는 성질
- 데이터 보안성: 불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질
- 데이터 효율성: 응답 시간, 저장 공간 활용 등이 최적화되어 사용자, 소프트웨어 등의 조건을 만족시켜야 하는 성질
데이터베이스 기술 트렌드
빅데이터
- 개념
빅테이터는 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 가능한 데이터 범위를 넘어서는 수십 크기의 비정형 데이터이다.
- 특성
데이터 양 + 데이터 다양성 + 데이터 속도
NoSQL
- 개념
전통적인 RBBMS와 다른 DBMS를 지칭하기 위한 용어로 조인 연산 필요 없이 수평적으로 확장 가능한 DBMS
- 특성
- Absically Available: 언제든지 데이터 접근할 수 있는 속성
- Soft-State: 노드의 상태가 외부에서 전송된 정보를 통해 결정된다는 속성
- Eventually Consistency: 일정 시간이 지나면 데이터의 일관성이 유지되는 속성
- Key-Value Store: 하나의 키: 하나의 Value
- Column Family Data Store: 하나의 Key 안에 (Column,Value) 조합으로 된 여러 개의 필드를 갖는 DB
- Document Store: Value의 데이터 타입이 Document 타입을 사용하는 DB
- Graph Store: 시멘틱 웹과 온톨로지 분야에서 사용되는 그래프로 표현하는 DB
키컬문그
데이터 마이닝
- 개념
대규모로 저장된 데이터 안에서 통계적 규칙으로 패턴을 찾아내는 기술
- 주요 기법
- 분류 규칙: 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 레코드의 결과 값을 예측하는 기법
- 연관 규칙: 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
- 연속 규칙: 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
- 데이터 군집화: 레코드들을 유사한 특성을 가진 소그룹으로 분할하는 작업
분연연데