Spark/Pyspark

김지율·2024년 3월 31일
0

데이터분석

목록 보기
25/25

분산클러스터란?
: 시스템의 전반적인 성능을 향상시키기 위해 계산 부하량을 여러 노드에서 분담하여 병렬처리하도록 구성하는 방식

spark





spark의 병렬성은 파티션과 익스큐터의 갯수로 결정됨


-> 쿼리를 날리거나 하는 것을 말함


pyspark (python+spark)

profile
김지율

0개의 댓글

관련 채용 정보