Spark

1.[데이터 플랫폼 운영 / 개발] - Spark 1 (Overview)

post-thumbnail

2.[데이터 플랫폼 운영 / 개발] - Spark 2 (Streaming)

post-thumbnail

3.[데이터 플랫폼 운영 / 개발] - Spark 3 (SK(Spark-Kafka) Streaming Code Template)

post-thumbnail

4.[Trouble Shooting] spark.driver.maxResultSize 관련

post-thumbnail

5.[Trouble shooting] ParquetDecodingException (Hive 테이블 조회)

post-thumbnail

6.[데이터 플랫폼 운영 / 개발] - Spark 4 (Pull based backpressure)

post-thumbnail

7.[데이터 플랫폼 운영 / 개발] - Spark 5 (Partition)

post-thumbnail

8.[데이터 플랫폼 운영 / 개발] - Spark 6 (분산형 공유 변수, Accumulator & Broadcast)

post-thumbnail

9.[데이터 플랫폼 운영 / 개발] - Spark 7 (Join)

post-thumbnail

10.[Trouble Shooting] Pyspark ImportError: No module named xxx & ModuleNotFoundError

post-thumbnail

11.[데이터 플랫폼 운영 / 개발] - Spark 8 (Streaming 2)

post-thumbnail

12.[데이터 플랫폼 운영 / 개발] - Spark 9 (Stream join)

post-thumbnail