✏️ [Database] 데이터베이스 개론

박상민·2023년 11월 12일
0

Database

목록 보기
1/9
post-thumbnail

목차

  • DB & DBMS & DB system 개념
  • data models 개념과 종류
  • schema & state 개념
  • three-schema architecture 소개
  • database language 종류

⭐️ Database & DBMS & DB System 개념

DataBase(DB): 전자적으로(electronically) 저장되고 사용되는 관련있는(related) 데이터들의 조직화된 집합(organized collection)

조직화된 집합
책장을 생각해보자. 책이 일정한 규칙 없이 마구잡이로 쌓여있다면 원하는 책을 찾을 때 비효율적이고 재고 관리도 쉽지 않는 등의 여러가지 불편함들이 많을 것이다.
그러나 조직직화된 데이터들은 내가 찾고 싶은 데이터들을 빨리 찾을 수 있게 해줄 뿐만 아니라 불필요한 데이터가 중복되어 생성되는 것도 막을 수 있고 불일치 또한 막을 수 있다.


대표적인 DBMS

DBMS(database management systems):사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템

  • DB를 정의하다 보면 부가적인 데이터가 발생
    • 부가적인 데이터: metadata
  • database를 정의하거나 기술하는(descriptive) data
    • catalog라고도 부름
  • metadata 또한 DBMS를 통해 저장/관리된다

Database system

  • database + DBMS + 연관된 applications
    • 줄여서 database라고도 부름

전체적인 데이터베이스 시스템

전체적인 데이터베이스 시스템을 살펴보자.

  1. 사용자가 프로그램에서 데이터를 조회, 저장 등을 할 때 쿼리를 작성해서 날린다.

  2. DBMS(Data Base Management System)가 쿼리를 받아서 쿼리를 분석해서 요청 사항을 파악하고 요청을 처리한다.

  3. 요청된 데이터가 어떤 형태로 되어있는지 부가적인 정보(metadata)를 알아야 데이터를 읽어올 수 있기 때문에 부가적인 정보를 확인

  4. 부가적인 정보를 파악하고 그것을 바탕으로 실제 요청받은 데이터를 찾아서 데이터를 애플리케이션에 반환

📌 data models 개념과 종류

data models

  • DB의 구조(structure)를 기술하는데 사용될 수 있는 개념들이 모인 집합
    • DB구조를 추상화해서 표현할 수 있는 수단을 제공한다.
  • data model은 여러 종류가 있으며 추상화 수준과 DB 구조화 방식이 조금씩 다르다
    • DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함한다.

DB 구조: 데이터 유형, 데이터 관계, 제약 사항 등등

data models 분류

  • conceptual( or high level) data models
  • logical (or representational) data models
  • physical(or low-level) data models

conceptual(or high level) data models

  • 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델
    • 추상화 수준이 가장 높음
  • 비즈니스 요구 사항을 추상화하여 기술할 때 사용

대표적인 concetual data models

  • entity-relationship model: 데이터베이스의 구조를 엔티티와 엔티티들간의 관계로 모델링
  • ER(Entity Relationship) diagram: 엔티티와 엔티티들간의 관계를 다이어그램으로 표시
  • 데이터베이스의 구조를 높은 수준으로 추상화해서 이해하기 쉽게 표현, 수단을 제공하는 모델

logical data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공

    • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
  • 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델

    • 어느정도 추상화는 되어 있음

백엔드 개발자는 logical data models을 많이 사용

가장 많이 사용되는 것은 relational data model이다.

relational은 쉽게 말해서 테이블을 의미한다.
relational data model에서는 데이터를 테이블 형태로 저장하게 되고 그래서 테이블을 relational이라고 부른다.

이후에는 relational data model을 집중적으로 공부한다.

logical data models 종류

  • relational data model - 가장 많이 사용
    • 앞에서 살펴본 유명 DBMS도 대부분 이에 기반
  • object data model
    • 위의 두개를 합친 object-relational data model

pysical data models

  • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공
    • data format, data orderings, access path 등등
  • access path: 데이터 검색을 빠르게 하기 위한 구조체, e.g.)index

실제로 컴퓨터에 저장되는 것과 밀접하게 모델링 할 수 있음

📌 schema & state 개념

database schema

  • data model을 바탕으로 databasse의 구조를 기술(description)한 것

data model이 데이터베이스의 구조를 모델링할 수 있는 방법을 제공한다면, database schema는 그 모델을 바탕으로 실제로 그 데이터베이스의 구조를 기술(표현)하는 것
그렇기 때문에 schema는 database를 설계할 때 정해지며 한 번 정해진 후에는 자주 바뀌지 않는다.


Database Schema 예시

데이터베이스의 데이터를 나타내는 STUDENT와 BOOK이 있고, 각 데이터가 어떤 속성을 가지는지 기술을 한다.

스키마를 보면 데이터베이스의 구조를 알 수 있다.

database state

  • database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.
    • 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다.
    • 혹은 database에 있는 현재 instances의 집합이라고도 한다.

데이터베이스 아키텍쳐에서 중요한 three-shema architecture

  • database system을 구축하는 architecture 중의 하나

    • 그러나 대부분 three-schema architecture를 따라간다.
  • user apllication으로 부터 물리적인(physical) database를 분리시키는 목적

    • 물리적인 데이터베이스의 구조가 조금씩 바뀔 수도 있다. 이런 경우에 실제 데이터베이스를 사용하는 User Application에는 영향을 끼치지 않기 위해 three-schema architecture를 사용한다.
  • 세가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다.


three-schema architecture의 세가지 level

  • external schemas(or user views) at external (or view) level
  • conceptual schemas at conceptual level
  • internal schemas at internal level

internal schema

  • 물리적인 저장 장치에 가장 가깝게 있는 스키마
  • 물리적으로 데이터가 어떻게 저장되는지 physical(or low-level) data model을 통해 표현
    • data storage, data structure, access path(index) 등등 실체가 있는 내용 기술

external schema

  • 실제 사용자가 바라보는 스키마
  • external views, user views라고도 불림
  • 특정 유저들이 필요로 하는 데이터만 표현
  • 그 외 알려줄 필요가 없는 데이터는 숨김
    • logical(or representational) data model을 통해 표현

Conceptual schema

  • 전체 database에 대한 구조를 기술
  • 물리적인 저장 구조에 관한 내용은 숨김
    • entities, data types, relationships, user operations, constraints에 집중
  • logical(or representational) data model을 통해 기술

three-schema architecture 정리
three-schema architecture는 안정적으로 데이터베이스 시스템을 운영하기 위해서 사용되는 아키텍쳐이다.
각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위한 목적으로 사용된다.
특정 스키마에 변경이 생긴다 할지라도 다른 스키마를 변경해야하는 것이 아니라 둘 사이의 맵핑만 변경해주면 된다. 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않는다.
실제로 데이터가 존재하는 곳은 internal level이다.

📌 database language 종류

✔︎ data definition language(DDL)

  • 대부분의 경우 conceptual schema를 정의하기 위해 사용되는 언어
  • internal schema까지 정의할 수 있는 경우도 있음

✔︎ storage definition language(SDL)

  • internal schema를 정의하는 용도로 사용되는 언어
    • 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨

✔︎ view definition language(VDL)

  • external shemas를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행

✔︎ data manipulation language(DML)

  • database에 있는 data를 활용하기 위한 언어
  • data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어

✔︎ 통합된 언어

오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기 보다는 통합된 언어로 존재한다.
대표적인 예가 relational database language: SQL 이다.


출처
글에 사용된 내용 및 사진은 모두 아래 영상의 자료입니다.
유튜브-쉬운코드
시니어 백엔드 개발자가 알려주는 데이터베이스 개론 & SQL

profile
스프링 백엔드를 공부중인 대학생입니다!

0개의 댓글