데이터베이스 기본 개념

Siyoon's dev library·2024년 7월 15일

데이터베이스

목록 보기
1/1
post-thumbnail

데이터베이스(DB)

전자적으로(electronically) 저장되고 사용되는 관련있는(related) 데이터들의 조직화된 집합(organaized collection)

  • 전자적으로 저장된다는 것은 데이터가 컴퓨터에 물리적으로 저장되고 사용되는 것을 말한다.
  • 관련있는 데이터같은 출처, 같은 목적 혹은 같은 서비스 안에서 생성되는 데이터다.
  • 조직화된 데이터는 내가 찾으려는 데이터를 빨리 찾을 수 있게 해줄 뿐 아니라, 중복되는 데이터의 생성과 데이터의 불일치를 막을 수 있다.

DBMS

  • Database Management Systems
  • 사용자가 DB를 정의하고 만들고 관리할 수 있는 기능을 제공하는 소프트웨어 시스템
  • DB를 정의하다보면 부가적인 데이터가 발생한다
  • 여기에서 말하는 부가적인 데이터metadata라고 부른다

metadata

  • database를 정의하거나 기술하는 데이터
  • catalog라고도 부른다
  • e.g.) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹 등
  • metadata도 DBMS를 통해 저장/관리 된다.

database system

  • 데이터베이스 시스템은 databse + DBMS + 연관된 application 로 구성
  • 줄여서 database라고 한다 (맥락에 따라 잘 이해해야함)
  • 아래 이미지 순서대로 진행됨
  • Application Programs / Queries: 여기서 쿼리는 데이터베이스에 접근해서 원하는 데이터를 가져오거나 혹은 원하는 데이터로 수정하는 요청
  • DBMS Software: DBMS에서 쿼리를 받아 쿼리가 어떤 요청을하는지 분석하고, 파악이 되면 처리를 함
  • Stored Database: 요청된 데이터를 처리하기 위해선 데이터가 어떤 형태로 되어있는지 부가적인 정보(metadata)를 알아야 하기 때문에 metadata를 바탕으로 실제 데이터를 찾아서 어플리케이션에 돌려준다.

data models

  • data model은 DB의 구조(structure)를 기술하는데 사용될 수 있는 개념들이 모인 집합
  • DB 구조를 추상화해서 표현할 수 있는 수단을 제공한다.
    여기서 DB 구조란 '데이터 유형', '데이터 간 관계', '제약 사항' 등을 말한다.
  • data model은 여러 종류가 있으며 추상화 수준과 DB 구조화 방식이 조금씩 다르다.
  • DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함된다.

    쉽게 말해, 데이터 모델이란 '데이터 유형', '데이터 간 관계', '제약 사항' 등 DB 구조를 추상화하여 표현하는 개념

data models 분류

  • conceptual (or high-level) data models
  • logical (or representational) data models
  • physical (or low-level) data models

1. conceptual data models

  • 일반 사용자(개발자 뿐만 아니라 비개발자까지)들이 쉽게 이해할 수 있는 개념들로 이루어진 모델
  • 추상화 수준이 가장 높다
  • 비즈니스 요구 사항추상화하여 기술할 때 사용한다
  • 대표적인 conceptual data modelentity-relationship model (ERD)
    => 데이터베이스의 구조엔티티와 엔티티들간의 관계로 모델링

2. logical data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공한다.
    => '디테일하게 DB를 구조화한다': 데이터가 물리적인 저장장치에 저장될 때의 구조와 크게 다르지 않는 수준에서 DB 구조화를 가능하게 한다.
  • 그럼 logical data model이 실제 저장장치에 어떻게 저장되는지 디테일하게 설명할 수 있는가?
    => No. 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델

logical data models 종류

  • relational-data-model (가장 많이 사용)
  • object-data-model
  • object-relational-data-model

이중에서 우리는 relational-data-model을 가장 많이 사용한다.

  • oracle, mysql, microsoftSql과 같은 유명한 DMBS도 relational-data-model에 기반한 DBMS
  • postgresqlojbect-relational-data-model

relational-data-model에서 relational은 row와 column을 가지고 있는 table을 의미한다. (row는 실제 데이터들로 구성되어져 있고, column은 데이터의 속성으로 구성되어져 있다.)

object-data-model객체 개념을 사용해서 데이터베이스를 모델링 한 개념이고, 위 두 개념을 합친게 object-relational-model이다

3. physical data models

데이터가 실제 저장 장치에 저장되는 형태와 가장 근접하게 데이터베이스 구조를 표현할 수 있는 데이터 모델

  • 컴퓨터에 데이터가 어떻게 파일형태로 저장되는지를 기술할 수 있는 수단을 제공한다
  • data format, data orderings(순서), access-path 등이 있다.
    (access-path란 데이터 검색을 빠르게 하기 위한 구조체이며, 대표적인 예시로 index가 있다)

database schema & state

databse schema

  • database schemadata model을 바탕으로 database 구조를 기술(description)한 것
  • 쉽게 말해, 데이터베이스 구조(데이터 형태, 제약사항, 데이터 간 관계 등)를 추상화하여 기술하는게 schema이며, 어떻게 기술할 것인지 사용되는 개념이 data-model
  • "데이터를 모델링한다" = "데이터 schema를 그린다" = "database 구조를 추상화한다"

우리는 database-schema를 보고 database 구조가 어떻게 되어있는지 알 수 있다.
예를 들어, 아래 이미지는 가장 많이 사용되는 relational-data-model에서의 database-schema다. 우리는 이 스키마를 보고 데이터베이스에 StudentBook이라는 데이터가 존재하며 각 데이터들이 어떤 속성을 갖는지 알 수 있다.

database-schema는 데이터베이스를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않는다.

databse state

  • database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.
  • 특정 시점에 databse에 있는 데이터를 databse state 혹은 snapshot이라고 한다.

three-schema architecture

  • database system을 구축하는 아키텍처 중 하나
  • 물리적인 database에서 구조가 조금씩 바뀔 수 있는데, 바뀔 때에도 database를 사용하는 유저 어플리케이션에는 영향을 주지 않기 위해 사용한다.
    (user application으로부터 물리적인 database를 분리시킨튼 목적)
  • 세가지 레벨이 존재하며 각각의 레벨마다 스키마가 정의되어 있다.
    1. external schemas(or user views) at external(or view) level
    1. conceptual schemas at conceptual level
    2. internal schemas at internal level

internal schema

  • 물리적인 저장장치에 가장 가깝게 있는 스키마
    => 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
  • data storage, data structure(자료 구조), access path 등 실체가 있는 내용을 기술한다

external schema

  • 실제 사용자가 바라보는 스키마
  • 그래서 external views, user views라고도 불림
  • 특정 유저들이 필요로 하는 데이터만 표현하고 그 외 알려줄 필요가 없는 데이터는 숨김
  • logical-data-model을 통해 표현

초창기에는 internal shemaexternal shema만 있었다.
하지만 각 유저가 필요로 하는 데이터들이 달라지다보니, internal 레벨에서 점차 중복되는 데이터가 생기며 관리가 힘들어지고 데이터 불일치가 발생하는 문제가 생겼다.
(같은 데이터를 포함해도도 조금씩 다른 internal schema들이 생김)

위 문제를 해결하기 위해 등장한게 conceptual schema

conceptual schema

  • internal shcema를 한번 추상화시켜서 표현한 스키마
  • 물리적인 저장 구조에 관한 내용은 숨기고
  • 논리적으로 "conceptual"하게 데이터베이스 전체 구조를 표현
  • entities, data types, relationships, 데이터를 활용할 수 있는 user operations, constraints(제약 사항)에 집중
  • logical-data-model을 통해 표현

정리해보면, three-schema-architecture

  • 안정적으로 데이터베이스 시스템을 운영하기위해 사용되는 아키텍처
  • 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
  • 예를들어, internal schema의 변경이 생기더라도 conceptual schema의 변경 필요 없이 둘 사이의 매핑만 변경하면 된다 (이는 상대적으로 쉬운 편)
  • 하지만 conceptual schema 변경시 external schema를 변경되지 않도록 하는게 까다롭다.
    => 그래서 오늘날의 DBMS는 three-level을 "완벽하게" 혹은 "명시적으로" 나누지는 않는다. (어느정도만 따르는 편)

🔸 각각의 스키마는 데이터베이스 구조를 "표현"하는 것이지, 실제 데이터가 존재하는 곳은 internal level에 있다.

Database Language

data defintion language (DDL)

  • conceptual schema를 정의하기 위해 사용되는 언어
  • internal schema까지 정의하는 경우도 있음

storage definition language (SDL)

  • internal schema를 정의하는 용도로 사용되는 언어
  • 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨

view definition language (VDL)

  • external schema를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행

통합된 언어

  • 오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기보다는 통합된 언어로 존재한다
  • 대표적인 예가 relational-database-language: SQL
  • SQL이 DML, VDL, DDL 역할을 모두 한다.
profile
독서를 좋아하고 투자에 관심이 많습니다. 피드백은 언제나 환영합니다.

0개의 댓글