batch vs stream processing
Batches : 1. 한정된 대량의 데이터 2. 특정시간 3. 일괄처리
-> 무거운 데이터를 처리 할때 좋다 하지만 데이터의 수가 달라지면 리소스를 비효율적으로 사용하게 된다.
Stream : 1. 실시간으로 쏟아지는 데이터
-> 실시간성이 보장될때, 데이터가 여러 소스로부터 들어올떄, 가벼운 처리를 할때 사용하게 된다.
parallel computing(병렬 컴퓨팅)
거의 모든 최신 데이터 처리 도구의 기초를 형성합니다. 이는 주로 메모리 문제뿐만 아니라 처리 능력에도 중요합니다.
cloud computing for data processing