Elastic search

jj·2021년 2월 26일

SS-hashtag-recommendation-project

목록 보기

12/15

인덱스 (Index)

샤드 (Shard)

타입 (Type)

문서 (Document)

필드 (Type)

매핑 (Mapping)

NoSQL (No Structured Query Language)
분산 처리를 통해 빠른 검색 가능
HTTP를 통해 JSON형식의 Restful API 이용
RDBMS에서 LIKE 검색할 때와 달리 검색어의 대소문자에 유연
비정형 데이터도 검색 가능
분석 통계 유용
역색인 구조
- 키워드를 통해 문서를 찾아내는 방식
- 책 뒷편의 색인된 키워드를 이용해 역으로 본문(문서)를 찾는 방식
- 검색이 매우 빠르다!!
스키마리스(Schemaless; 인덱스(→ 데이터베이스) 가 없더라도 문서를 추가하면 인덱스를 자동생성 - 비권장)

└ 엘라스틱서치에서 문자열은 단순 문자열(keyword)과 형태소 분석이 가능한(text)타입으로 구분하는데 자동 생성은 둘 다 생성해 버리므로 공간낭비가 심하고 데이터 구조가 복잡할 수록 검색 품질이 저하될 수 있음

└ action.auto_create_index를 false로 설정해서 끌 수 있음
전문 검색(Full-text Search; 내용 전체를 색인해서 특정 단어가 포함된 문서를 검색) 가능
멀티테넌시(Multi-tenancy; 상이한 인덱스일지라도 동일한 필드명을 대상으로 검색 가능)
트랜잭션과 롤백 기능을 제공하지 않으므로 데이터 손실의 위험도 있음
업데이트 명령 시, 기존 내용을 삭제하고 새로 생성하는 방식

재밌는게 재밌는거다