Spark Clustering 환경 설정 하기 전 각 노드에 원격 접속을 편하게 하기 위하여 SSH 설정을 합니다. SSH 설치, ssh-keygen, config 창에 노드 정보를 입력 순으로 하면 ssh설정을 할 수 있습니다.
Spark는 JVM에서 동작합니다. 따라서 Spark Clustering을 위해서는 Java가 필수적으로 설치되어 있어야 합니다. 이 포스트에서는 우분투에서 자바 설치 및 환경설정을 하는 법을 정리하겠습니다.
Spark 설치 및 환경 변수 설정을 한 후 Spark Clustering 및 애플리케이션을 실행해보았습니다.