[대규모 서비스를 지탱하는 기술] 24장. 전문 검색기술의 응용범위

June·2021년 12월 28일
0

하테나 다이어리를 대상으로 한 검색엔진이란, 하테나 다이어리의 전문을 검색 대상으로 해서 하테나 키워드로 이를 검색 가능하게 하는 시스템이다.

전에는 RDB로 처리했다.

누군가 블로그에 새로운 글을 작성했을 때 해당 글에 포함되어 있는 키워드를 전부 추출한다. 그러면 '이 블로그는 OO와 xx라는 단어를 포함하고 있어'라고 알 수 있게 된다. 이 단어와 블로그의 연관성을 데이터베이스의 레코드로서 저장해두는 것이다.

다만 이 방식은 확장성이 매우 떨어진다.

검색기술의 응용

그래서 취한 방법은 검색엔진을 만들어서 검색하는 것이다. 사용자가 검색어를 입력하면, 검색 시스템에서 입력해서 결과를 얻는 것이다.

하테나 북마크의 전문 검색

자신이 북마크한 사이트만을 대상으로 한 전문 검색엔진이다.

검색 시스템을 별도로 만들어서 사용자가 북마크를 추가하는 타이밍에 맞춰 각 사용자별로 검색 인덱스를 준비해두고 이를 갱신한다. 검색할 때에는 해당 사용자의 인덱스에서만 검색한다. 이렇게하면 검색 시스템을 직접 만들 수 있다.

0개의 댓글