타입 간의 관계
실제 데이터를 처리하는 작업
에 대한 명세제약 조건
, 무결성
유지를 위한 DB의 보편적 방법트랜젝션을 모델링
하는 단계 ****트랜젝션의 인터페이스
설계, 논리적 스키마를 설계하는 단계반 정규화
수행기본키
와 참조하는 외래키
1:N
, 1:1
, N:M
트리 구조
, 상하관계 존재그래프 형태로 구성
관계 데이터 모델의 구성요소
관계 대수
R X S
: R과 S에 속한 모든 튜플을 연결해 만들어진 새로운 튜플로 구성순수 관계 연산자
R ⋈ S
: 공통 속성을 통해서 R과 S의 튜플들을 연결해 만들어진 튜플R **÷** S
: 릴레이션 S의 모든 튜플과 관련 있는 R의 튜플 반환관계 해석
비절차적 언어
1 : 1
/ 1 : N
/ N : M
이상 현상 : 릴레이션 조작시 발생하는 비합리적인 현상
삽입 이상
: 해당 정보의 불필요한 세부정보를 입력해야하는 경우삭제 이상
: 정보 삭제시 원치 않는 다른 정보가 같이 삭제되는 경우갱신 이상
: 중복 데이터 중에서, 특정 부분만 수정되어 중복된 값이 모순을 일으키는 경우함수 종속
릴레이션에서 속성의 의미와 속성 간 상호 관계로부터 발생
하는 제약조건
결정자 / 종속자 : X → Y 일때, X는 결정자, Y는 종속자
함수 종속 종류
부분 함수 종속 : 기본키가 복합키일 경우, 기본키를 구성하는 속성 중 일부에게 종속
(이름, 성별)
이 기본키 라고 했을 때,
(이름, 성별)
→ 주소
/ (이름, 성별)
→ 지역번호
관계가 성립함
✨ 그러나 (이름)
→ 주소
관계도 성립함
완전 함수 종속 : X → Y 관계 일때, Y는 X의 전체 속성에 대해 종속하고, 부분 집합 속성에 종속하지 않음
이행 함수 종속 : X → Y, Y → Z 관계 일 때, X → Z가 성립하는 경우
정규화의 개념
(1정규형) 1차 정규화 : 원자값으로 구성, 하나의 값으로 구성하기
(2정규형) 2차 정규화 : 부분 함수 종속
제거.
(고객명, 서비스 이름) → 서비스 이용 기간
/ (서비스 이용) → 서비스 가격
(3정규형) 3차 정규화 : 이행 함수 종속
제거
(A → B), (B → C) 이면 (A → C)
인 이행 함수의 종속을 제거해야함보이스-코드 정규형 : 결정자 함수 종속
제거
(4정규형) 4차 정규화
다치 종속
제거, 특정 속성 값에 따라 선택적인 속성을 분리(5정규형) 5차 정규화
조인 종속
을 제거하는 과정.성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링 기법
성능 향상
과 관리의 효율성
이 증가반 정규화 기법
1 : 1
, 1 : N
을 통합하여 조인 횟수를 줄여 성능 향상sum
, group by
)를 위한 테이블 추가데이터 무결성은 DB에 저장된 값
과 현실의 값
이 일치하는 성질
무결성은 권한이 있는 사용자로부터 데이터베이스를 보호한다.
데이터 무결성 종류
기본키 값
이나 NULL
이어야함기준이 되는 속성
연속적인 숫자나 날짜
를 기준으로 파티셔닝해시 함수 값
에 의한 파티셔닝, 균등한 데이터 분할 가능저장될 데이터
에 대한 명시적 제어가 가능한 파티셔닝2개 이상 결합
하는 기법회전
하면서, 새로운 행을 파티션에 할당하는 기법개념 : 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합된, 데이터의 집합
중복성 제거
, 무결성 확보
, 일관성 유지
, 유용성 보장
정의
데이터베이스 특성
실시간 응답
이 가능하게 해야함최신
의 데이터를 유지해야함동시에 같은 내용
의 데이터 공유 가능사용자가 요구하는 내용
으로 데이터를 찾아야함DBMS : 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안
의 기능을 지원하는 소프트웨어
데이터 웨어하우스
사용자 의사결정에 도움
을 주기 위해, DBMS에 축적된 데이터를 공통 형식으로 변환, 관리일관성
유지, 하나로 통합
시간
에 따른 변경 항상 반영스냅 샷
형태로 존재데이터 마트 : 특정 주제, 부서 중심으로 구축된 소규모
단위 주제의 데이터 웨어하우스
페타바이트
수준의 대규모 데이터정형, 비정형, 반정형
다양한 데이터빠른 속도
오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼
가상화된 대형 스토리지 형성
, 거대한 데이터 세트를 병렬로 처리할 수 있는 자바 기반
주요 기술
NoSQL
가용성
중시일관성 중시
저장된 데이터 안에서 체계적
이고 자동적
으로 통계적 규칙이나 패턴
을 찾아내는 기술
의미 있는 패턴 파악
/ 예측하여 의사결정에 활용
주요 기법
특성
을 찾아내어 분류모형
을 만듦종속관계
를 찾아내는 기법시간 관련 정보
가 포함된 형태의 기법유사한 특성
을 몇 개의 소그룹으로 분할데이터 관련 용어
텍스트
에서 패턴 또는 관계 추출웹
에서 얻는 방대한 양의 정보로부터 유용한 정보 찾아내기분석에는 활용하지 않는
데이터정의
하고 설명
해주는 데이터이후의 이용
을 보장