# Nori

6개의 포스트
post-thumbnail

Elasticsearch nori 한글 형태소 분석기

Elasticsearch 공식 페이지 : 6.7.2 노리 (nori) 한글 형태소 분석기Elasticsearch 6.6 버전부터 공식 지원하는 한글 형태소 분석기mecab-ko-dic 사전 사용사전 정보를 이용해 형태소를 분리user_dictionary 옵션사용자 사전

2021년 11월 8일
·
0개의 댓글

[TIL]형태소 분석기 사용자 사전 사용하기

사용자 사전의 단어(word)는 크게 단일어와 복합어로 구성된다12(여기서 융합 합성어는 복합어가 아닌 단일어로 취급한다). 위와 같이 단일어는 홀로 명시하고 복합어는 원형어 다음에 형태소(낱말)들을 띄어쓰기와 함께 나열한다.1(사용자 사전을 정의할 때 주의할 점이 있

2021년 10월 3일
·
0개의 댓글
post-thumbnail

한글 분석기 Nori를 사용하여 위키 데이터 색인하고 검색 실습하기

정제된 위키 데이터를 엘라스틱서치에 색인해보자.혹시 정제된 위키 데이터가 없다면 아래 링크를 따라 정제된 위키 데이터를 준비하면 된다.https://velog.io/@yaincoding/엘라스틱서치-실습하기-좋은-위키-데이터셋-다운받고-정제하기엘라스틱서치 플러

2021년 8월 30일
·
0개의 댓글
post-thumbnail

엘라스틱서치 실습하기 좋은 위키 데이터 다운받고 정제하기

'엘라스틱서치 실무 가이드' 책을 보며 엘라스틱서치를 공부하고 있다. 이 책이 영화 데이터, 웹 로그 데이터 스냅샷을 제공하기는 하지만 한글 분석기도 사용해볼 겸 제대로 된 대량의 한글 문서 데이터를 사용해보기로 했다.↓ 위키 덤프 데이터 링크https://d

2021년 8월 30일
·
0개의 댓글
post-thumbnail

elasticsearch index 생성 삭제 수정, 노리 토큰 설정

elasticsearch@7.12의 index 생성에 대해 curl로 간단히 정리해보자. 이 때 노리 형태소 분석기와 토큰을 설정해줄 것이다.새로운 인덱스를 생성하는 방법이다. 인덱스에는 기본적으로 settings, mappings, alias가 있을 수 있는데, 이번

2021년 5월 25일
·
0개의 댓글
post-thumbnail

ElasticSearch Nori 형태소 분석기 사용해보기

토이 프로젝트를 진행하면서 ElasticSearch에 대해 공부를 시작했습니다.토이 프로젝트를 진행하면서 검색엔진에 대한 필요성을 느꼈고 형태소 분석을 통한 검색을 하깅 위해 nori라는 플러그인을 사용해야한다고 하여 이렇게 포스팅을 남기게 되었습니다.저는 elasti

2021년 2월 28일
·
0개의 댓글