Elastic Search

김루루룽·2022년 8월 15일

blog✏️

목록 보기

33/61

Elasticsearch란?

모두가 필요한 검색을 더 빠르게 찾도록 도와준다.
텍스트, 숫자, 위치 기반 정보, 정형 및 비정형 데이터 등
모든 유형의 데이터를 위한 무료 검색 및 분석엔진으로
분산형과 개방형을 특징으로 한다.

Apache Lucene을 기반으로 구축되었으며, 간단한 REST API, 분산형 특징, 속도, 확장성으로 유명하다.
데이터 수집, 보강, 저장, 분석, 시각화를 위한 무료 개방형 도구 모음인 Elastic Stack의 핵심 구성 요소다.

Elasticsearch는 어디에 사용되나요?

애플리케이션 검색
웹사이트 검색
엔터프라이즈 검색
로깅과 로그 분석
보안 분석
비즈니스 분석

Elasticsearch는 어떻게 작동하나?

로그
시스템 메트릭
웹 애플리케이션

다양한 소스로부터 원시 데이터가 Elasticsearch로 흘러들어간다.
데이터 수집은 원시 데이터가 엘라스틱 서치에서 색인되기 전에 구문 분석, 정규화, 강화되는 프로세스이다.
일단 색인되면, 사용자는 이 데이터에 대해 복잡한 쿼리를 실행하고 집계를 사용해 데이터의 복잡한 요약을 검색할 수 있다.

Elasticsearch 인덱스는 무엇인가?

index는 서로 관련되어 있는 문서들의 모음이다.
JSON문서로 데이터를 저장한다.
각 문서는 일련의 키와 그에 해당하는 값을 서로 연결한다.

Elasticsearch는 역 인덱스라고 하는 데이터 구조를 사용하는데,
이것은 아주 빠른 풀텍스트 검색을 할 수 있다.
역 인덱스는 문서에 나타나는 모든 고유한 단어의 목록을 만들고,
각 단어가 발생하는 모든 문서를 식별한다.

Kibana는 어디에 사용되나?

Elasticsearch를 위한 시각화 및 관리 도구로서,
실시간 히스토그램, 선 그래프, 파이 차트, 지도 등을 제공합니다.
Kibana에는 사용자가 자신의 데이터를 기반으로 사용자 정의한 동적 인포그래픽을 만들 수 있는 Canvas, 위치 기반 정보 데이터를 시각화하기 위한 Elastic Maps 같은 고급 애플리케이션도 포함된다.

Elasticsearch의 장점

1️⃣. 빠르다.

Lucene을 기반으로 구축되기 때문에, 풀텍스트 검색에 뛰어나다.
실시간 검색 플랫폼이다.문서가 색인될 때부터 검색 가능해질 때까지의 대기 시간이 아주 짧다.

2️⃣. 본질상 분산적이다.

저장된 문서는 샤드라고 하는데 여러 다른 컨테이너에 걸쳐 분산되며,
이 샤드는 복제되어 하드웨어 장애 시에 중복되는 데이터 사본을 제공한다.

3️⃣. 광범위한 기능 세트와 함께 제공

속도, 확장성, 복원력뿐 아니라,
데이터 롤업, 인덱스 수명 주기 관리 등과 같이 데이터를 훨씬 더 효율적으로 저장하고 검색할 수 있게 해주는 기본 기능이 탑재되어있다.

4️⃣. 데이터 수집, 시각화, 보고를 간소화

Beats와 Logstash의 통합은 엘라스틱 서치로 색인하기 전에 데이터를 훨씬 더 쉽게 처리할 수 있게 해준다.
Kibana는 Elasticsearch 데이터의 실시간 시각화를 제공하며, UI를 통해 애플리케이션 성능 모니터링(APM), 로그, 인프라 메트릭 데이터에 신속하게 접근할 수 있다.

참조:
Elasticsearch란?