스파크 SQL는 쿼리를 돌리기 위해 두가지 엔진을 사용한다. Catalyst
& Tungsten
스파크 SQL의 질의 옵티마이저로 Logical Plan
을 Physical Plan
으로 바꾸는 일을 수행
compile time
에 계산 (runtime 시 계산하지 않고)Predicate Pushdown
: join & filter -> filter & join Project Pruning
: 연산에 필요한 컬럼만 가져오기 spark.sql(query).explain(True)
코드 제너레이션
)