[DB]데이터베이스 기본 개념

김태준·2023년 11월 8일

데이터베이스

목록 보기
1/4

데이터베이스

전자적으로(electronically) 저장되고 사용되는 관련있는(related)데이터들의 조직화된 집합(organized collection)

DBMS(database management systems)?

사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템
ex) PostgreSQL MySQL ORACLE SQLServer

  • DB를 정의하다 보면 부가적인 데이터가 발생한다 -> metadata

metadata? (데이터를 설명하기위한 데이터)

  • database를 정의하거나 기술하는(descriptive)data
  • catalog 라고도 부름
  • 데이터 유형,구조,제약 조건,보안,저장,인덱스,사용자 그룹 등등
  • metadata 또한 DBMS를 통해 저장/관리된다.

database system?

  • database + DBMS + 연관된 applications
  • 줄여서 database라고도 부름

데이터베이터 시스템 동작하는 방식

사용자가 어플리케이션으로 요청을 하면 쿼리가 발생한다.DBMS가 쿼리를 받아 쿼리를 분석하고 요청을 처리한다.
요청한 데이터가 어떤 형태인지에 알아야 데이터을 읽어올 수 있으니 데이터를 확인하고 확인한 데이터를 데이터베이스에서 찾아 어플리케이션으로 되돌려준다.

data models?

  • DB의 구조(structure)를 기술하는데 사용될 수 있는 개념들이 모인 집합
  • DB 구조추상화해서 표현할 수 있는 수단을 제공한다.
  • data model은 여러 종류가 있으며 추상화 수준과 DB구조화 방식이 조금씩 다르다.
  • DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함한다.
    DB 구조 : 데이터 유형,데이터 관계(relationship),제약 사항(constraints) 등등

data models 분류

  • conceptual (or high-level) data models
  • logical (or representational) data models
  • physical (or low-level) data models

conceptual data models

  • 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델
  • 추상화 수준이 가장 높음
  • 비즈니스 요구 사항을 추상화하여 기술할 때 사용

ex) entity-relationship model (ERD)

logical data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
  • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
  • 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델

logical data models 종류

  • relational data model
    대부분의 DBMS는 relational data model 기반을 둠 ex) ORACLE,MySQL,SQLServer
  • object data model
  • object-relational data model
    ex) PostgreSQL

physical data models

  • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공
  • data format,data orderings,access path 등등
  • access path : 데이터 검색을 빠르게 하기 위한 구조체 e.g)index

schema & state?

database schema

  • data model을 바탕으로 database의 구조를 기술(description)한 것
  • schema는 database를 설계할 때 정해지며 한번 정해진 후 에는 자주 바뀌지 않는다.

database state

  • database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.
  • 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다.
  • 혹은 database에 있는 현재 instances의 집합 이라고도 한다.

three-schema architecture

  • database system을 구축하는 architecture 중의 하나
    - user application으로 부터 물리적인(physical) database를 분리시키는 목적

  • 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다.

  • external schemas (or user views) at external (or view) level

  • conceptual schemas at conceptual level

  • internal schemas at internal level

internal schema

  • 물리적으로 데이터가 어떻게 저장되는지
    physical data model을 통해 표현
  • data storage,data structure
    access path(index) 등등 실체가 있는 내용 기술

external schema

  • external views,user views 라고도 불림
  • 특정 유저들이 필요로 하는 데이터만 표현
  • 그 외 알려줄 필요가 없는 데이터는 숨김
  • logical data model을 통해 표현

conceptual schema

  • 전체 database에 대한 구조를 기술
  • 물리적인 저장 구조에 관한 내용은 숨김
  • entities,data types,relationships
    user operations,constraints에 집중
    -logical data model을 통해 기술

three-schema architecture

  • 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
  • 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음
  • 데이터가 존재하는 곳은 internal level

data language

data definition language (DDL)

  • conceptual schema를 정의하기 위해 사용되는 언어
  • internal schema까지 정의할 수 있는 경우도 있음

storage definition language (SDL)

  • interal chema를 정의하는 용도로 사용되는 언어
  • 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨

view definition language (VDL)

  • external schemas를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL역할까지 수행

data manipulation language (DML)

  • database에 있는 data를 활용하기 위한 언어
  • data 추가,삭제,수정,검색 등등의 기능을 제공하는 언어

통합된 언어

  • 오늘날의 DBMS는 DML,VDL,DDL이 따로 존재하기 보다는 통합된 언어로 존재
  • 대표적인 예가 relational database language : SQL
profile
Java_Spring_JPA_DB

0개의 댓글