이번에 할당받은 프로젝트는 검색엔진 내재화에 필요한 '검색 사전 관리도구' 프로젝트이다. Elasticsearch는 전체 텍스트 검색과 분석 기능을 제공하는 오픈 소스 검색 엔진이다. ES를 사용하여 검색엔진을 구현하는 과정에서 검색 사전 관리도구는 특히 검색 쿼리의
Elasticsearch는 강력한 검색 및 데이터 분석 엔진으로, 대용량 데이터를 빠르게 처리하고 검색할 수 있으며, Kibana는 Elasticsearch 데이터를 시각화하고 탐색하기 위한 사용자 인터페이스를 제공한다. Kibana는 Elasticsearch에서 검색
사전 관리 도구엔 기본적으로 사전을 관리하시는 분께서 색인 어휘가 이미 등록되어 있는지, 등록할 어휘가 형태소 분석이되었을 때 어떻게 결과가 나와야하는지 알아야 한다. 따라서 ElasticSearch에 \_search 요청으로 색인 여부를 응답받고 \_analyze 요
“C1-2의 두 예시들은 형태소분석이 아예 되지 않는다.discard_punctuation 옵션은 nori_tokenizer 내에서 구두점을 제거할지 여부를 설정한다.true로 설정하면, 구두점이 포함된 단어가 토큰화 과정에서 제거된다.false로 설정하면, 구두점이