Apache Spark

1.[Spark] Streaming 기본 개념

post-thumbnail

2.[Spark] Spark Streaming 피보나치 수열 예제

post-thumbnail

3.[Spark Streaming] Late Data Handling

post-thumbnail

4.[Spark] Spark RDD 기본 정리

post-thumbnail

5.[Spark] 파티션, 셔플링에 대해서

post-thumbnail

6.[Spark] join, 집합 연산

post-thumbnail

7.[Spark] 데이터 정렬과 그루핑

post-thumbnail

8.[Spark] 누적변수와 공유변수(accumulator, broadcast variable)

post-thumbnail

9.[Spark] DataFrame 그룹별 topN 예제, 여러 파일 읽기

post-thumbnail

10.[Spark] Failed to bind SparkUI 발생 원인 및 해결방안

post-thumbnail

11.[Spark] spark-shell 사용시 jar 의존성 추가

post-thumbnail

12.[Spark] RDB 데이터 읽기/쓰기

post-thumbnail

13.[Spark] MariaDB Connector syntax error 해결

post-thumbnail

14.[Spark] 날짜 다루기 (date, timestamp)

post-thumbnail

15.[Spark Structured Streaming] Kafka read, write

post-thumbnail

16.[Spark Structured Streaming] 은 1개의 Streaming Aggregation만 지원한다.

post-thumbnail

17.[Spark] Executor 는 최소 메모리 기준이 존재한다.

post-thumbnail

18.[Spark] Spark FAIR 스케줄링에 대하여

post-thumbnail

19.[Spark] 애플리케이션간 스케줄링

post-thumbnail

20.[Spark] Spark YARN/Standalone 메모리 설정

post-thumbnail

21.[Spark] Cluster mode

post-thumbnail

22.[Spark] Rest API 정리

post-thumbnail