B+Tree

dongle·2022년 12월 10일

CS

목록 보기

1/1

키에 의해서 각각 식별되는 레코드의 효율적인 삽입, 검색과 삭제를 통해 정렬된 데이터를 표현하기 위한 트리자료구조의 일종입니다.

특징

장점

단점

B-Tree와 동일하나 B-Tree는 Best Case의 경우 루트 노드에서 끝날 수 있지만

B+Tree는 모든 경우에 대해 리프 노드로 가서 순차 탐색함으로써 데이터를 찾아야 합니다

통상적인 검색으로 삽입하고자 하는 노드가 어느 리프 노드에 해당하는지 체크합니다.

리프 노드가 full 상태가 아니라면 오름차순 정렬에 맞게 삽입한다.
리프 노드가 full 상태라면 노드를 분할해야 한다.

a) 새로운 리프 노드를 구성하고 기존 리프 노드 데이터의 절반을 옮긴다.
- 새로운 리프 노드의 최소 키(기존 리프 노드의 중간값)를 부모 노드에 삽입하여 기준 포인터로 삼는다.
- 부모 노드 역시 리프 노드의 key를 받았으므로 full 상태인지 체크해야 한다.
  - 부모 노드가 쪼개지지 않는 시점이 올 때까지 상향식으로 반복한다.
루트가 쪼개지면 새로운 루트 노드를 생성하되 1개의 키와 2개의 양쪽 포인터로 구성되어야 하며 기존 루트 노드의 중간 key는 새로운 루트 노드에 저장한 뒤 제거한다.

루트에서 출발하여 key가 속한 leaf 노드를 찾아 리프 노드의 key를 삭제합니다.

삭제한 뒤 리프 노드가 최소 key 이상인지 체크해야 합니다.

삭제할 key가 index set에 존재하지 않을 경우

a) 리프 노드의 key 개수가 t−1t−1보다 클 때
- 리프 노드의 key만 삭제하고 종료
b) 리프 노드의 key 개수가 t−1t−1일 때
- 형제 노드 중 하나라도 key의 개수가 t−1t−1보다 큰 경우
  - 왼쪽 노드가 크다면 왼쪽 노드의 가장 큰 값을 받고 현재 노드의 첫 번째 값이 바뀌므로 부모 노드의 key도 바뀐 값으로 변경
  - 오른쪽 노드가 크다면 현재 노드는 변화가 없으나 우측 노드의 최솟값이 현재 노드로 옮겨감에 따라 우측 노드의 부모 key를 다음 값으로 바꿔준다.
- 형제 노드가 모두 t−1t−1인 경우
  - 어떤 경우라도 최소 차수를 만족할 수 없으므로 형제 노드들 중 하나와 병합해야 한다. 왼쪽 혹은 오른쪽 노드와 병합하되 왼쪽은 현재 노드의 부모 key, 오른쪽에 합치면 우측 노드의 부모 key가 삭제된다.
  - 부모 노드의 key 개수가 1 감소한 경우 부모 노드의 key 개수가 t−1미만이면 다시 reconstruct를 해야한다.

a) 리프 노드의 key 개수가 t−1t−1보다 클 때

b) 리프 노드의 key 개수가 t−1t−1일 때

형제 노드 중 하나라도 key의 개수가 t−1t−1보다 큰 경우
- 왼쪽에서 가져오면 현재 노드의 첫 번째 값이 바뀌므로 index set의 key 값도 가져온 값으로 교체
- 오른쪽에서 가져오면 우측 노드의 첫 번째 값이 바뀌므로 index set의 기존 우측 노드의 첫 번째 값을 다음 값으로 교체
형제 노드가 모두 t−1t−1인 경우
- 한쪽 형제와 현재 노드를 병합한다. 왼쪽과 병합한 경우 현재 노드의 부모 key를 삭제, 오른쪽과 병합한 경우 오른쪽 노드의 부모 key를 삭제한다.
- 부모 key가 삭제되었으므로 부모 노드의 key 개수가 t−1미만이면 다시 reconstruct를 수행한다.

참고

개발자를 꿈꾸는 학생입니다!