KD-Tree에 대해 설명해주세요.

SJ·2024년 4월 1일

Knowledge

SLAM 기술면접 질문 100선

목록 보기

29/58

이 게시글은 장형기님의 SLAM 기술면접 질문 100선에 대한 제 나름대로의 답을 정리한 것입니다.

KD-Tree(K-dimensional Tree):
Binary Search Tree를 확장한 개념으로, k차원 공간의 점들을 구조화하는 공간 분할 자료 구조

Binary Search Tree란?
데이터를 저장할 때 크기가 큰지 작은지만 비교하여 저장 공간을 정하는 방식

데이터가 들어오게 되면 부모 노드와 비교하여 작으면 왼쪽 잎새 노드에 저장하고 크면 오른쪽 잎새 노드에 저장합니다.

그림을 살펴 보면 7을 기준으로 작은 값인 3은 왼쪽에 저장되고 큰 값인 8은 오른쪽에 저장됩니다.

그 후 들어오는 데이터는 이 기준에 따라 비교되어 내려오다 자신에게 맞는 위치의 잎새 노드에 저장됩니다.

이러한 기준으로 정렬했기 때문에 데이터를 찾을 때 탐색해야할 위치를 쉽게 찾을 수 있는 장점이 있지만 데이터가 순서대로 들어온다면 계산 복잡도가 늘어나는 단점도 있습니다.

이제 이를 확장한 kd-tree에 대해 알아봅시다.

kd-tree는 하나의 값의 크기를 비교하는 binary search tree를 확장하여 높은 차원의 vector도 저장할 수 있습니다.

kd-tree에서의 분할 기준은 binary search tree와 같이 값의 크기입니다.

차원이 큰 vector에는 많은 값이 들어있는데 어떤 값을 비교해야할까요?
data 차원 중 가장 분산값이 큰 차원의 값들을 비교하여 data를 정렬하게 됩니다.

예를 들어보겠습니다.
X={x1:(3,1),x2:(2,3),x3:(6,2),x4:(4,4),x5:(3,6),x6:(8,5),x7:(7,6.5),x8(5,8),x9:(6,10),x10:(6,11)}

이것은 데이터 x를 kd-tree로 정렬한 것입니다. 이것을 어떻게 배열하였는지 함께 살펴보겠습니다.