배치 프로세싱 | 스트림 프로세싱 | |
---|---|---|
데이터 종류 | Bounded data(끝이 있는 데이터) | Unbounded data(끝이 없는 데이터) |
처리 방식 | 일정기간 단위로 수집 후 일괄 처리 | 연속된 데이터를 하나씩 처리 |
처리량 | 대규모 데이터 배치 | 주로 소량의 레코드 |
성능 | 몇 분 ~ 몇 시간 지연시간 | 몇 초 또는 몇 밀리초의 지연 시간(준 실시간) |
사용환경 | 복잡한 분석이 요구되는 환경, 데이터 처리량이 많은 환경 | 실시간 처리 및 분석 정보가 요구되는 환경 |
사용사례 | 급여 및 청구 시스템 (ex. 1월 정산 데이터) | 이상 탐지(Anomaly Detection) 및 실시간 모니터링 시스템, SNS 데이터 분석 |
대표 제품 | Hadoop MapReduce, Spark | Spark Streaming, Flink, Kafka Streams |