Spark는 JVM에서 동작합니다. 따라서 Spark Clustering을 위해서는 Java가 필수적으로 설치되어 있어야 합니다. 이 포스트에서는 우분투에서 자바 설치 및 환경설정을 하는 법을 정리하겠습니다.
스파크 공식 홈페이지에 따르면 Spark 3.4.0 버전부터는 Java 8은 더 이상 지원하지 않는다고 합니다. 그렇기에 Java 11을 설치하였습니다.
sudo apt-get install -y openjdk-11-jdk
java -version
sudo find / -name java-11-openjdk-amd64 2>/dev/null
sudo vim /etc/environment
PATH 맨 뒤에 추가 ":/path/to/java-11-openjdk-amd64"
JAVA_HOME="/path/to/java-11-openjdk-amd64"
#저의 경로는 "/usr/lib/jvm/java-11-openjdk-amd64"였습니다.
source /etc/environment
sudo vim ~/.bashrc
#맨 밑에 아래의 코드를 추가
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
source ~/.bashrc
총 노드 8개(컴퓨터 8대)에 똑같은 작업을 진행했습니다. 읽어주셔서 감사합니다.