비정형 데이터 등 모든 유형의 데이터를 위한 무료 검색 및 분석 엔진
빠른 환경 구성 속도
실시간 검색 플랫폼
입니다. 이것은 문서가 색인될 때부터 검색 가능해질 때까지의 대기 시간이 아주 짧다
. 이 대기 시간은 보통 1초
보안 분석
, 인프라 모니터링
같은 시간이 중요한 사용 사례에 이상적분산적
샤드라고 하는 여러 다른 컨테이너에 걸쳐 분산
하드웨어 장애 시에 중복되는 데이터 사본을 제공
페타바이트의 데이터를 처리
할 수 있게 해준다.광범위한 기능 세트와 함께 제공
데이터 롤업
, 인덱스 수명 주기 관리
등과 같이 데이터를 훨씬 더 효율적으로 저장하고 검색할 수 있게 해주는 강력한 기본 기능이 다수 탑재데이터 수집, 시각화, 보고를 간소화
Kibana
는 Elasticsearch 데이터의 실시간 시각화를 제공
하며, UI를 통해 애플리케이션 성능 모니터링(APM), 로그, 인프라 메트릭 데이터에 신속하게 접근 가능로깅과 로그 분석
동시
에 실시간에 가까운 속도로 검색 및 집계 수행 가능내용 전체
를 색인
해서 특정 단어가 포함된 문서를 검색
- 역 인덱스(Inverted Index)
키워드
를 통해 문서를 찾아내는 방법
규모
가 수평적
으로 늘어날 수 있음
Replica
를 통해 데이터의 안정성을 보장
Restful API를 통해 수행
Data CRUD Elasticsearch Restful SELECT GET INSERT PUT UPDATE POST DELETE DELETE
단독으로 사용될 수 있지만
간단한 작동 원리를 그림으로 표현하기 위해 ELK먼저 설명합니다.elsaticsearch
는 위에 말했던 것 처럼 데이터를 저장하는 저장소
라고 이해하시면 됩니다.logstash
는 실시간 파이프라인 기능을가진 오픈소스 데이터 수집 엔진
kibana
는 시각적
으로 es의 색인된 데이터와 es의 관리
를 도와주는 오픈소스원시 데이터
가 Elasticsearch에 저장
된다.색인된 데이터
에 대해 쿼리를 실행
하며 데이터를 분석 및 검색
한다.Kibana
로 es의 데이터를 시각화
하고 대시보드로 확인 할 수 있다.전체 작업을 담당
인덱싱한 문서가 포함된 샤드를 보유
합니다. 데이터 노드는 CRUD, 검색 및 집계와 같은 데이터 관련 작업을 처리master 노드와 분리되는 것이 좋음
일을 대신하는 노드
전처리 파이프라인
을 실행할 수 있다.클러스터 간 클라이언트 역할
을 하며 원격 클러스터 에 연결기계 학습 API 요청을 처리
변환 API 요청을 처리
분산
해서 저장하는 방법
index를 여러 shard로 쪼갠 것
성능 향상을 위해
인덱스의 샤드 갯수를 조정
하여 튜닝각 인덱스 별로 최소 1개 이상 존재
primary shard 의 복제본
JSON 형색으로 데이터가 저장됨
서로 연결
📌 여담
📚 참고
안녕하세요 현 IT 보안 회사에서 재직 중입니다
로그분석 및 검색, 수집 하는데 ES 사용하고 있습니다!