위 세가지 기술 스택을 통해,
수집
-처리
-분석
플랫폼을 표방한다.
Text, 숫자, Geospatial, 정형 및 비정형 데이터등의
데이터에 대한 검색, 분석이 가능한
검색엔진 | Information Retrieval 라이브러리
용어 정리
- 검색 엔진
- 컴퓨터 시스템에 저장된 정보를 찾아주거나
웹 검색을 도와주도록 설계된 검색 시스템 또는 컴퓨터 프로그램
- IR
정보검색
- 사용자가 입력한 키워드에 대해서 적절한 문서를 찾는 것을 의미
- 정보들은 대량의 문서 형태
- 검색 대상 : 비정형 | 반정형
- SQL을 사용하지 않음
정답
<관련성
REST API, 분산처리, 속도, 확장성이 특징
샤드
를 통해 데이터를 분산하여 빠르게 처리1초
뒤에 검색 가능Elasticsearch는 검색 특화
RDBMS는 SQL을 통해 원하는 정보 검색 가능,
그러나 단순한 검색에 해당
다양한 소스에서
데이터를 수집하여 변환한 후 자주 사용하는 저장소로 전달하는 기능
파이프라인을 구성하는 각 요소들은 전부
플러그인
형태
모든 형태의 데이터 처리 가능
자체 내장 메모리
, 파일 기반 Queue
를 통해벌크 인덱싱
및 파이프라인 배치 크기 조정
을 통한 병목현상 방지 및 성능 최적화데이터를 입력받고
실시간으로 변경하고
변경한 데이터를 다른 시스템에 전달한다.
Input
,Output
이 필수,Filter
는 옵션
Elasticsearch에 있는 데이터를 시각화
- 저장된 데이터를 분석, 시각화하는데 주로 사용