
위 세가지 기술 스택을 통해,
수집-처리-분석플랫폼을 표방한다.

Text, 숫자, Geospatial, 정형 및 비정형 데이터등의
데이터에 대한 검색, 분석이 가능한
검색엔진 | Information Retrieval 라이브러리
용어 정리
- 검색 엔진
- 컴퓨터 시스템에 저장된 정보를 찾아주거나
웹 검색을 도와주도록 설계된 검색 시스템 또는 컴퓨터 프로그램
- IR
정보검색
- 사용자가 입력한 키워드에 대해서 적절한 문서를 찾는 것을 의미
- 정보들은 대량의 문서 형태
- 검색 대상 : 비정형 | 반정형
- SQL을 사용하지 않음
정답<관련성
REST API, 분산처리, 속도, 확장성이 특징
샤드를 통해 데이터를 분산하여 빠르게 처리1초 뒤에 검색 가능

Elasticsearch는 검색 특화
RDBMS는 SQL을 통해 원하는 정보 검색 가능,
그러나 단순한 검색에 해당

다양한 소스에서
데이터를 수집하여 변환한 후 자주 사용하는 저장소로 전달하는 기능
파이프라인을 구성하는 각 요소들은 전부
플러그인형태
모든 형태의 데이터 처리 가능
자체 내장 메모리, 파일 기반 Queue를 통해벌크 인덱싱 및 파이프라인 배치 크기 조정을 통한 병목현상 방지 및 성능 최적화
데이터를 입력받고
실시간으로 변경하고
변경한 데이터를 다른 시스템에 전달한다.
Input,Output이 필수,Filter는 옵션


Elasticsearch에 있는 데이터를 시각화
- 저장된 데이터를 분석, 시각화하는데 주로 사용