다양한 데이터타입 소개

Han Hanju·2023년 7월 25일
0

Elasticsearch

목록 보기
9/10
post-thumbnail

데이터타입

keyword

  • 키워드 형태로 사용할 데이터에 적합
  • 분석기를 거치지않고 원문 그대로 인덱싱
  • 검색시 필터링, 정렬, 집계 필요
  • 띄어쓰기도 구분 완전히 같아야함

Text

  • 인덱싱시 지정한 Analyzer가 문자열로 인식하고 분석을 시작
  • 기본은 standard analyzer
  • 문장 형태의 데이터에 적합함
  • Full Text Search가 가능 -> 특정 단어 검색이 가능
  • 정렬, 집계가 필요한경우 Text와 Keyword 멀티 필드로 지정 -> 목적에 맞게 활용 가능
  • Fielddata

Full Text Search의 기능:

  1. 텍스트 분석: 입력된 텍스트를 토큰화하고 불용어를 제거하여 검색에 적합한 형태로 변환합니다.

  2. 역색인(Inverted Index): 토큰화된 단어들을 역색인 구조로 저장하여 효율적인 검색을 지원합니다.

  3. 유사성 평가: 검색어와 검색 대상 텍스트 데이터의 유사성을 평가하여 가장 관련성이 높은 결과를 찾습니다.

  4. 검색 결과 랭킹: 검색 결과에 순위를 매겨 사용자가 가장 관련성이 높은 결과를 먼저 볼 수 있도록 합니다.

Full Text Search는 정보를 효율적으로 탐색하고 검색하는 데 필수적인 기술로, 인터넷 검색 엔진과 데이터베이스 시스템에서 널리 사용되고 있습니다. Elasticsearch와 같은 Full Text Search 엔진은 이러한 기능들을 포함하고 있어 대용량 텍스트 데이터를 신속하게 검색하고 분석하는 데 도움이 됩니다.

Array

  • 모두같은타입으로 구성

Boolean

  • true, false
  • 문자로 들어와도 해석해서 저장됨

Range

  • 데이터의 범위를 지정

Object

  • 한필드 안에 하위 필드 넣는 객체타입
  • 한 요서가 여러 하위정보를 가지고있음

Nested

  • Object객체 배열을 독립적으로 색인하고 쿼리
profile
Data Analytics Engineer

1개의 댓글

comment-user-thumbnail
2023년 7월 25일

유익한 글이었습니다.

답글 달기