khj2872.log
khj2872.log
profile
강혁진
글시리즈소개
태그 목록
  • 전체보기(14)
  • Data Intensive Application Design(4)
  • 데이터 중심 애플리케이션 설계(4)
  • spark(4)
  • 하둡 완벽 가이드(2)
  • hadoop(2)
  • 빅데이터(1)
  • Change Data Capture(1)
  • HDFS(1)
  • CDC(1)
  • 대규모 서비스(1)
  • 변경 데이터 캡처(1)
  • sqoop(1)
  • Debezium(1)
  • stream processing(1)
  • bigdata(1)
  • 스트림 프로세싱(1)
  • 대규모 트래픽(1)
  • elasticsearch(1)
전체보기 (14)Data Intensive Application Design(4)데이터 중심 애플리케이션 설계(4)spark(4)하둡 완벽 가이드(2)hadoop(2)빅데이터(1)Change Data Capture(1)HDFS(1)CDC(1)대규모 서비스(1)변경 데이터 캡처(1)sqoop(1)Debezium(1)stream processing(1)bigdata(1)스트림 프로세싱(1)대규모 트래픽(1)elasticsearch(1)

Apache Spark란?

1. Spark의 등장 배경 기존 빅데이터 처리 시스템은 하둡 에코시스템(Hadoop Ecosystem) 이 시장을 지배 하둡은 다수의 서버를 클러스터화 하여 빅데이터를 클러스터에서 분산 저장 및 병렬 처리하여 처리 속도를 높여줌 하지만 하둡의 MapReduce는 Di

bigdataspark
2022년 1월 27일
·
0개의 댓글
·
2