TIL 2021.05.30 [Lucene]

Kyu·2021년 5월 30일
0

TIL

목록 보기
140/322

루씬은 어플리케이션이나 웹사이트에 검색기능을 쉽게 만들수잇는 자바로 만들어진 full-text search 라이브러리이다.
full-tet index에 content를 추가하는 방식으로 루씬은 작동한다. 그리고 인덱스를 가지고 쿼리를 실행해서 정렬된 결과를 반환한다.
content는 SQL이나 NoSQL 디비가 될 수도있고 파일이나 웹사이트에서 가져오는 것이 될수도있다.

루씬은 빠르게 결과 응답을 가져올수있다. 왜냐면 텍스트를 직접적으로 검색하는게 아니라 인덱스를 검색하기 때문이다.
그래서 full-text search 라이브러리라고 하는 것이다.
루씬이 인덱스를 검색하는 방식..즉, full-text search가 검색하는 방식은 책 맨뒤에 있는 나열되어 있는 키워드들과 페이지들을 검색하는 방식과 유사하다.

이런 타입의 인덱스를 inverted index라고 한다
페이지중심의 데이터 구조 (page->words) 를 키워드중심의 데이터구조로 invert하기 때문이다.

루씬에서 문서란 검색과 인덱스의 한 단위이다.
한 인덱스는 하나 또는 그 이상의 문서들로 구성되어 있다.

참고
http://www.lucenetutorial.com/basic-concepts.html
http://www.lucenetutorial.com/your-first-project.html (해볼거리)

profile
TIL 남기는 공간입니다

0개의 댓글