관계 대수의 개요

k_bell·2024년 10월 7일

목록 보기

8/12

관계 데이터 모델에는 두 가지의 정형적인 언어가 지원된다.

관계 해석
: 원하는 데이터만 명시하고 질의를 어떻게 수행할 것인가는 명시하지 않는 선언적인 언어이다. 흔히 말하는 비절차적 언어로서, 컴퓨터가 직접 실행할 수 있는 형태는 아니다. 따라서 관계 해석으로 표현된 질의를 관계 대수나 SQL로 변환하는 추가적인 작업이 필요하다.
관계 대수
: 각각의 관계 연산자들이 수행되는 순서를 명시하는 절차적 언어이다. 우리가 관계 데이터베이스에서 사용하는 SQL의 이론적인 기초가 바로 관계 대수이다. 따라서 관계 DBMS는 SQL 질의를 DBMS 내부에서 관계 대수식으로 변환한 후 이를 바탕으로 최적의 질의 수행을 찾는다.

관계 대수

관계 대수 연산을 통해 기존의 릴레이션들로부터 새로운 릴레이션을 생성한다. 관계 대수식에 다른 연산자들을 적용하여 보다 복잡한 관계 대수식을 점차적으로 만드는 것이 가능하다. 따라서 관계 대수 연산 과정에서 생성된 중간 결과 릴레이션은 또 다른 관계 대수 연산자의 입력으로 사용되는 것이 가능하다.

관계 대수의 8대 연산자

8대 관계 연산자란, 관계형 데이터베이스에서 자주 사용되는 8가지 기본적인 연산자들을 의미한다. 이러한 연산자들은 데이터베이스의 기초적인 연산들이며, 관계형 데이터베이스에서 매우 중요한 개념이다. 관계 연산자들을 잘 이용하고 사용함으로써, 데이터베이스의 질의를 보다 효율적으로 수행할 수 있기 때문이다.

🟨 셀렉션 : 테이블에서 한 개 끄집어낸다
🟨 프로젝션 : 학생 테이블에서 특정한 학번, 이름만 출력
🟨 합집합 : union. 중복되는 것을 제외하고 테이블을 합친다
🟨 교집합 : 겹치는 것만 테이블로 생성
🟨 차집합 : A - B 결과 테이블
🟨 카티션 곱 : 나올 수 있는 모든 조합의 경우의 수
🟨 조인 : 결합
🟨 디비전 : 분할

셀렉션 연산자 $\sigma$

✅ 원하는 조건을 만족하는 튜플을 도출함

✅ $\sigma$ (sigma) 로 연산자를 표현

✅ 셀렉션 조건을 predicate 라고 함

$\sigma _{DNO = 3}$ (EMPLOYEE) : EMPLOYEE 테이블에서 DNO가 3인 투플을 도출

프로젝션 연산자 $\pi$

✅ 원하는 조건을 만족하는 애트리뷰트들을 도출함

✅ $\pi$ 로 연산자를 표현

✅ 중복되는 값들은 제거

보통 셀렉션의 결과 릴레이션에는 중복되는 값이 애초에 존재할 수 없음.

$\pi_{TITLE}$ (EMPLOYEE) : EMPLOYEE 테이블에서 TITLE 컬럼 도출

합집합 연산자 $\cup$

✅ 두 릴레이션의 튜플들을 합침

✅ 합친 결과 릴레이션에서 중복된 투플들은 제외됨

✅ $\cup$ 로 연산자를 표현

✅ 합집합은 합집합 호환 조건이 맞아야만 실행할 수 있다.

✅ 카디날리티 : max (n, m) <= C (T) <= n + m

n과 m 은 각각 R과 S의 카디날리티이다. T 는 결과 릴레이션.

Info
합집합 호환 (union compatible)
서로 다른 테이블에 union 하는데 있어, 차수가 다르거나 도메인이 다르면 안된다. 이 규칙은 합집합, 차집합, 교집합에 모두 적용된다.
예를 들어, 아래의 EMPLOYEE 릴레이션과 DEPARTMENT 릴레이션은 기본적으로 차수가 다르므로 합집합 호환 조건에 맞지 않는다고 볼 수 있다.

그러나 EMPLOYEE 릴레이션에서 DNO를 프로젝션한 결과 릴레이션과 DEPARTMENT 릴레이션에서 DERPTNO를 프로젝션한 결과 릴레이션이 있다고 하자. 두 결과 릴레이션은 차수가 같고 도메인이 같으므로 합집합 호환 조건을 만족한다.