📘3-2단원 : 데이터 입출력 구현 - 물리 데이터 저장소 설계, 데이터베이스 기초 활용하기
🎓 1. 물리 데이터 모델 설계
✏️ 물리 데이터 저장소 구성
🏷️ 데이터 제약조건 설계
📘 참조무결성 제약조건
릴레이션 사이에 대해 참조의 일관성을 보장하기 위한 조건이다.
- 제한 : 참조무결성의 원칙을 위배하는 연산을 거절하는 옵션이다.
- 연쇄 : 참조되는 릴레이션에서 튜플을 삭제하고, 참조되는 릴레이션에서 이 튜플을 참조하는 튜플도 함께 삭제하는 옵션이다.
- 널 값 : 참조되는 릴레이션에서 튜플을 삭제하고, 참조하는 릴레이션에서 해상 튜플을 외래키에 NULL 값을 넣는 옵션이다.
🏷️ 파티션 설계
파티션의 종류에는 레인지 파티셔닝, 해시 파티셔닝, 리스트 파티셔닝, 컴포지트 파티셔닝 등이 있다.
🐥 레해리컴
- 레인지 파티셔닝 : 연속적인 숫자나 날짜를 기준으로 하는 파티셔닝 기법이다.
- 해시 파티셔닝 : 파티션 키의 해시 함수 값에 의한 파티셔닝 기법이다.
- 리스트 파티셔닝 : 명시적 제어가 가능한 파티셔닝 기법이다.
- 컴포지트 파티셔닝 : 레해리 중에 2개 이상의 파티셔닝을 결합하는 기법이다.
🏷️ 파티션의 장점
성능 향상, 가용성 향상, 백업 가능, 경합 감소
🐥 성가백합
== 성가대가 백합꽃을 들고 노래한다.
🎓 2. 데이터베이스 기초 활용하기
✏️ 데이터베이스 종류
🏷️ 데이터베이스 개념
다수의 사용자가 사용할 목적으로 통합하여 관리되는 데이터의 집합니다.
📘 관계형 데이터베이스 관리시스템(RDBMS)
: 관계형 모델을 기반으로 하는 가장 보편화된 데이터베이스 관리시스템이다.
📘 계층형 데이터베이스 관리시스템(HDBMS)
: 상하 종속적인 관계로 계층화되어 관리하는 데이터베이스이다.
✏️ DBMS
🏷️ DBMS 개념
데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업 등의 기능을 지원하는 소프트웨어이다.
🏷️ DBMS 유형
- 키-값 DBMS : 키 값 제공, 메모리 기반에서 성능 우선 시스템 기능 제공 DBMS
- 컬럼 기반 데이터 저장 : (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DBMS
- 문서 저장 DBMS : 값의 데이터 타입이 문서인 DBMS
- 그래프 DBMS : 시맨틱 웹과 온톨로지 분야에서 사용되는 그래프로 데이터를 표현하는 DBMS
🐥 키컬도그
🏷️ DBMS 특징
- 데이터 무결성 : 부적절한 자료가 입력되어도 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질
- 데이터 일관성 : 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터의 값이 변함없이 일정
- 데이터 회복성 : 장애가 발생하면 특정 상태로 복구되는 성질
- 데이터 보안성 : 불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질
- 데이터 효율성 : 응답 시간, 저장 공간 활용 등이 최적화되어 사용자, 소프트웨어 등의 조건을 만족시켜야 하는 성질
✏️ 데이터베이스 기술 트렌드
🏷️ 빅데이터
📘 빅데이터 개념
빅데이터는 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 가능한 데이터 범위를 넘어서는 수십 크기의 비정형 데이터이다.
📘 빅데이터의 특성
데이터의 양 (Volume) + 데이터의 다양성 (Variety) + 데이터의 속도 (Velocity)
🏷️ NoSQL
📘 NoSQL 개념
전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 조인 연산 필요 없이 수평적으로 확장이 가능한 DBMS다.
📘 NoSQL의 특성
- Basically Available : 언제든지 데이터는 접근할 수 있는 속성
- Soft-State : 노드의 상태가 외부에서 전송된 정보를 통해 결정된다는 속성
- Eventually Consistency : 일정 시간이 지나면 데이터의 일관성이 유지되는 속성
📘 NoSQL의 유형
- Key-Value Store : 하나의 Key에 하나의 Value를 가지고 있는 형태
- Column Family Data Store : 하나의 Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DB
- Document Store : Value의 데이터 타입이 Document 타입을 사용하는 DB
- Graph Store : 시멘틱 웹과 온톨로지 분야에서 사용되는 그래프로 표현하는 DB
🐥 키컬도그
🏷️ 데이터 마이닝
📘 데이터 마이닝 개념
대규모로 저장된 데이터 안에서 통계적 규칙으로 패턴을 찾아내는 기술
📘 데이터 마이닝 주요 기법
- 분류 규칙 : 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 레코드의 결과 값을 예측하는 기법
- 연관 규칙 : 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
- 연속 규칙 : 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
- 데이터 군집화 : 레코드들을 유사한 특성을 가진 소그룹으로 분할하는 작업
🐥 분연 연데