분산클러스터란? : 시스템의 전반적인 성능을 향상시키기 위해 계산 부하량을 여러 노드에서 분담하여 병렬처리하도록 구성하는 방식
spark spark의 병렬성은 파티션과 익스큐터의 갯수로 결정됨 -> 쿼리를 날리거나 하는 것을 말함
pyspark (python+spark)