
4가지만 잘 기억하면된다.!!
-역인덱스 파일
-인덱스 writer = 색인
-인덱스 서쳐 = 검색
-인덱스 애널라이자 = 형태소분석?
Elastic이란? = 아파치 루신을 기본으로 한 오픈소스 분산 검색엔진이다...
-fulltext검색이란, 단어 검색이 아닌 문서자체를 검색하는것???
-긴문장이 있으면 이를 analysis(형태소분석기)가 볼 수 있도록 prasego text로 추출하고 붆석기에 넣ㄴ음 -> 그다음 루신이 인덱스(색인)을 생성해줌
[동사] 색인 (indexing) : 데이터가 검색될 수 있는 구조로 변경하기 위해 원본 문서를 검색어 토큰들으로 변환하여 저장하는 일련의 과정입니다. 이 책에서는 색인 또는 색인 과정이라고 표기합니다.
[명사] 인덱스 (index, indices) : 색인 과정을 거친 결과물, 또는 색인된 데이터가 저장되는 저장소입니다. 또한 Elasticsearch에서 도큐먼트들의 논리적인 집합을 표현하는 단위이기도 합니다. 이 책에서는 인덱스라고 표기합니다.
검색 (search) : 인덱스에 들어있는 검색어 토큰들을 포함하고 있는 문서를 찾아가는 과정입니다.
질의 (query) : 사용자가 원하는 문서를 찾거나 집계 결과를 출력하기 위해 검색 시 입력하는 검색어 또는 검색 조건입니다. 이 책에서는 질의 또는 쿼리라고 표현합니다.

출처 : 엘라스틱 가이드북 [ https://esbook.kimjmin.net/02-install/2.1]


키워드를 통해 문서를 찾아내는 방식이다.

IndexWriter 색인 후 IndexSearch로 검색하는 과정
입력 받은 문자열에서 검색가능한 정보 구조로 분석 및 분해하는 과정
구성요소
Analyzer는 형태소 분석을 위한 최상위 클래스이며 하나의 tokenizer와 다수의 filter로 구성이된다.

token filter는 정의된 순서에 맞춰 적용되기 때문에 적용 시 순ㅇ서가 중요하다.
루씬에서 제공하고 있는 한글 처리를 위한 Analyzer는 CJK와 Nori Analyzer가 있다.

WRAP UP
- 루씬을 이용해서 검색 apppliacation이나 검색엔진을 만들 수 있다.
- 루씬을 이용해서 다양한 text분석 app을 만들수있다.
- 루씬의 index,즉 segemnts파일은 불변
- 루씬의 핵심클래스 3개 IndexWriter, IndexSearcher, Analyzer 꼭 기억하기!!!!!!!
- 소스코드는 꼭 참고( 나중에 보자,, java라 어려움)