데이터베이스 레코드 저장 구조

개발기록·2024년 7월 2일

CS

목록 보기

2/6

데이터베이스에서 레코드란 일련의 필드로 이루어진 데이터 조각이다
레코드가 모여 파일을 구성하게 되고
파일이 모여 데이터베이스가 된다
데이터베이슨는 데이터를 읽을 때 물리적인 최소 단위인 Disk Block 단위로 읽기 때문에 Block과 레코드의 관계를 정의하기 위해 하나의 Block에 들어 갈 수 있는 레코드의 수를 Blocking Factor 라고 정의한다

가변 길이 레코드를 사용하는 경우 데이터베이스의 입장에서 데이터를 찾는 것이 어렵다.
단순히 몇번째 데이터인지 안다고 해도 주소를 알 수 없다
그렇다면 가변 길이 레코드인 경우 어떻게 레코드를 조회할 까?
위의 그림 처럼 저장된다.
가장 먼저 Block Header에 다음과 같은 정보가 저장된다
- 총 레코드 수
- free space가 끝나는 지점
- 각 레코드의 시작 위치, 크기 (slot)
이를 통해서 새로운 데이터가 들어오면 Free Space에 할당한다
또 데이터가 삭제되면 빈 공간을 나머지 데이터들이 채우도록 이동한다
- 이 때 slot의 값은 삭제하지 않고 유지해야 한다
- 외부의 포인터 (인덱스)에 의해 해당 값이 사용 될 수 있기 때문이다
또한 외부의 포인터 (인덱스)는 직접 데이터를 가르키는 것이 아닌 Slot을 통해 가르킨다고 한다
Blocking factor는 (블록 크기 - 블록 헤더 크기) / (레코드 크기 + slot 크기) 로 결정된다고 볼 수 있다