👉 SparkContext
👉 Spark Application
👉 Job
👉 Stage
👉 Task
👉 Driver
👉 Spark Executors
👉 Cluster Manager
빠른 처리 속도
스파크의 가장 큰 장점!
다양한 프로그래밍 언어 지원
스칼라, 파이썬, 자바, R 등
다양한 라이브러리 지원
SQL, DataFrame, MLlib, Spark Streaming 등
실시간에 가까운 프로세싱 가능
MapReduce로 하둡에 저장된 데이터 처리 가능
Spark Streaming으로 실시간 처리 가능
높은 호환성
하둡, 아파치 메소스, 쿠버네티스, 스탠드얼론, 클라우드 등에서 작동