DB
전자적으로 저장되고, 사용되는 관련(related) 데이터들의 조직화 된 집합(organized collection)
DBMS
- database management systems
- 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템
- PostgreSQL, MySQL, Oracle, MS SQL server 등
- DB를 정의하다 보면 부가적인 데이터(=meta data)가 발생함
- DB에만 사용되는 개념은 아님, data about data라고도 하는데 데이터를 설명하기 위한 데이터
- DB에서는 DB를 정의하거나 기술하는(descriptive) data
- catalog라고도 부름
- ex) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹 등
- metadata 또한 DBMS를 통해 저장/관리됨
database syetem
- database + DBMS + 연관된 애플리케이션
- 줄여서 database라고도 부르기도 함

- Queries? : 데이터베이스에 접근해서 데이터 생성/삭제/변경/읽기 등을 요청같은 것
- 동작 방식
사용자가 쿼리를 날리면 DBMS가 쿼리를 분석하여 요청된 데이터가 어떤 형태를 가지고있는지 부가적인 정보(Sorted Database Definition,meta data)를 통해 알아낸뒤
실제 요청받은 데이터를 찾아서 어플리케이션에 돌려줌
data models
-
DB의 구조를 기술하는데 사용될 수 있는 개념들이 모인 집합
-
DB의 구조를 추상화해서 표현할 수 있는 수단을 제공함
-
data model은 여러 종류가 있으며 추상화 수준과 DB의 구조화 방식이 조금씩 다름
-
DB에서 읽고 쓰기 위한 기본적인 동작(operations)도 포함함
-
분류
- coceptual(= high-level) data models
- logical(= representational) data models
- physical(= low - level) data models
conceptual data models
-
일반 사용자들이 쉽게 이해할 수 있는 개념들로 이루어진 모델
-
추상화 수준이 가장 높음
-
비즈니스 요구 사항을 추상화하여 기술할 때 사용
-
대표적으로 entity-relationship model이 있음

logical data models
- 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
- 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
- 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델
- 종류
- relational data model
- object data model
- object-relational data model
- relational data model : 가장 많이 사용되는 데이터 모델

테이블을 relation이라고하며, row는 데이터 각각을 의미, colume은 데이터의 속성을 의미
physical data models
- 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공
- data format, data orderings, access path 등
- access path : 데이터 검색을 빠르게 하기 위한 구조체(=index)
database schema
- data model을 바탕으로 database의 구조를 기술한 것
- schema는 database를 설계할 때 정해짐 한 번 정해진 후에는 자주 바뀌지 않음

database state
- database에 있는 실제 데이터는 꽤 자주 바뀔 수 있음
- 특정 시점에 database에 있는 데이터를 database state(=snapshot)이라고 함
- 혹은 database에 있는 현재 instances의 집합이라고도 표현함
three - schema architecture
- database system을 구축하는 architeture 중의 하나(가장 자주 사용됨)
- user application으로 부터 물리적인 database를 분리시키는 목적
- 세 가지 level이 존재하며 각각 level마다 schema가 정의 되어 있음
- 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않음(매핑만 바꿔주면됨)
- internal의 변경에 대해 conceptual이 바뀌지 않게하는 건 상대적으로 쉽지만,
conceptual의 변경에 대해 external이 바뀌지 않게하는건 상대적으로 어려움 그래서
대부분의 DBMS가 three level을 명시적으로 나누진 않음
- 실제 데이터가 있는곳은 internal level

-
internal schema
- internal level에 정의되어 있는 schema
- 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
- data storage, data structure, acess path 등 실체가 있는 내용 기술
-
external schema
- external(=view) level에 정의되어 있는 schema
- external views, user views 라고도 불림
- 특정 유저들이 필요로 하는 각각의 데이터만 표현해줌
- 그 외 알려줄 필요가 없는 데이터는 은닉
- logical data model을 통해 표현
-
conceptual schema
- conceptual level에 정의되어 있는 schema
- 전체 database의 대한 구조를 기술함
- 물리적인 저장 구조에 관한 내용은 은닉
- entities, data type, relationships, user operations, constraints에 집중
- logical data model을 통해 표현됨
database language
-
DDL(=data definition language)
- conceptual schema를 정의하기 위해 사용되는 언어
- internal schema까지 정의할 수 있는 경우도 있긴함
-
SDL(=storage definition language)
- internal schema를 정의하기 위해 사용되는 언어
- 최근에는 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨
-
VDL(=view definition language)
- external schemas를 정의하기 위해 사용되는 언어
- 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행함
-
DML(=data manipulation language)
- database에 있는 data를 활용하기 위한 언어
- data의 CRUD등의 기능을 제공하는 언어
-
SQL(=relational database language)
- DDL, VDL, DML등을 통합한 언어
- 오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기 보다는 SQL처럼 통합된 언어로 존재
Reference
쉬운코드 유튜브 채널