[spark 4] intro (Spark 내부동작)

data_hamster·2023년 8월 5일
0


스파크 파일 포맷
json, csv 아브로, parquet 차이

엑시큐션 플랜
스파크가 우리 코드 어떻게 실행하는데
action transformation

  • job - 다수 스테이지 - 다수의 태스크
    스파크 웹 UI를 통해 확인할 수 있음

버켓팅, 파티셔닝. 저장 HDFS

profile
반갑습니다 햄스터 좋아합니다

0개의 댓글