[면접을 위한 CS 지식 노트] 데이터베이스의 기본

재오·2023년 5월 15일
1

CS

목록 보기
16/35
post-thumbnail

데이터베이스의 기본

데이터베이스는 일정한 규칙을 통해 구조화되어 저장되는 데이터의 모음이다. 해당 데이터베이스를 제어하는 시스템을 DBMS라고 하며, 데이터베이스 안에 있는 데이터들은 삽입, 삭제, 수정 조회 등을 수행할 수 있다.

엔터티

엔터티는 사람, 장소, 물건, 사건 등 여러 개의 속성을 지닌 명사를 의미한다. 엔터티는 약한 엔터티와 강한 엔터티로 나뉘는데 예를 들어 A가 혼자서는 존재하지 못하고 B의 존재 여부에 따라 종속적이라면 A가 약한 엔터티이고 B가 강한 엔터티 이다.

릴레이션

릴레이션은 데이터베이스에서 정보를 구분하여 저장되는 기본단위이다.엔터티에 관한 데이터를 데이터베이스는 릴레이션 하나에 담아서 관리한다. 릴레이션은 관계형 데이커베이스에서는 '테이블'이라고도 한다.

테이블과 컬렉션

데이터베아스는 크게 관계형 데이터베이스와 NoSQL 데이터베이스로 나눌 수 있는데 관계형 데이터베이스는 MySQL이 대표적이고 NoSQL 데이터베이스의는 MongoDB가 대표적이다.

속성

속성은 릴레이션에서 관리하는 구체적이며 고유한 이름을 갖는 정보이다. 관리해야 할 필요가 있는 속성들만 엔터티의 속성이 된다.

도메인

도메인은 릴레이션에 포함된 각각의 속성들이 가질 수 있는 값의 집합을 의미한다.

필드와 레코드


위의 그림을 보면 회원이라는 엔터티는 member라는 테이블로 속성인 이름, 아이디, 주소 등을 가지고 있으며 name, ID, address 라는 필드를 가진다. 그리고 이 테이블에 쌓이는 행 단위의 데이터를 레코드라고 한다. 이 레코드는 튜플이라는 이름으로 불리기도 한다.

필드 타입

필드는 타입을 갖는다. 예를 들어 이름은 문자열, 전화보는 숫자이다. DBMS마다 타입은 다르지만 mySQL을 기준으로 알아보겠다.

  • 숫자 타입: TINYINT, SMALLINT, MEDIUMINT, INT, BIGINT
  • 날짜 타입: DATE, DATETIME, TIMESTAMP
  • 문자 타입: CHAR, VARCHAR, TEXT, BLOB, ENUM, SET
    CHAR과 VARCHAR은 모두 그 안에 수를 입력해서 몇자를 입력할지 정한다. CHAR은 고정 길이 문자열이며 VARCHAR은 가변 길이 문자열이다. TEXT는 큰 문자열 저장에 쓰이고 BLOB은 이미지, 동영상 등 큰 데이터를 저장할 때 쓰인다. ENUM과 SET은 모두 문자열을 열거한 타입이다.

관계

데이터베이스에 테이블은 여러 개가 존재하고 이러한 테이블은 서로의 관계가 정의되어 있다. 이러한 관계를 관계화살표로 나타낸다.

1:1 관계

1:1 관계는 유저당 유저 이메일 한개씩 있는 이러한 관계를 의미한다.

1:N 관계

1:N 관계는 한 유저당 여러 개의 상품을 장바구니에 넣어두는 관계를 의미한다. 물론 하나도 넣지 않은 0개도 포함되어야 한다.

N:M 관계

학생과 강의의 관계를 정의하면 N:M 관계가 된다.

테이블 간의 관계를 조금 더 명확하게 하고 테이블 자체의 인덱스를 위해 설정된 장치를 의미한다. 기본키, 외래키, 후보키, 슈퍼키, 대체키가 있다.

슈퍼키는 유일성이 있고 후보키 중에서 기본키로 채택되지 못한 키가 대체키가 된다. 유일성은 중복되는 값이 없으며 최소성은 최소 필드만 써서 키를 형성할 수 있는 것을 말한다.

기본키

기본키는 유일성과 최소성을 만족하는 키이다. 이는 테이블의 데이터 중 고유하게 존재하는 속성이고 중복되면 안된다.

  • 자연키: 중복된 값들을 제외하며 중복되지 않은 것을 자연스레 뽑다가 나오는 키를 의미한다. 자연키는 언젠가는 변하는 속성을 갖는다.
  • 인조키: 인위적으로 생성한 키를 의미하고 자연키와는 반대로 변하지 않는다. 보통 기본키는 인조키로 설정한다.

외래키

외래키는 다른 테이블의 기본키를 그대로 참조하는 값으로 개체와의 관계를 식별할 때 사용한다. 외래키는 중복되어도 상관없다.

후보키

후보키는 기본키가 될 수 있는 후보들이며 유일성과 최초성을 동시에 만족한다.

대체키

대체키는 후보키가 두 개 이상일 경우 어느 하나를 기본키로 지정하고 남은 후보키들을 말한다.

슈퍼키

슈퍼키는 각 레코드를 유일하게 식별할 수 있는 유일성을 갖춘 키이다.

profile
블로그 이전했습니다

0개의 댓글