
이번 글에서는 Apache spark 3.5.7 버전을 내 python3.9 가상환경에 설치해본다.
https://www.oracle.com/java/technologies/javase/jdk17-archive-downloads.html


제어판 > 시스템 환경 변수 편집 > 고급 > 환경 변수
시스템 변수 > 새로 만들기
JAVA_HOME 편집
JAVA_HOME
C:\Program Files\Java\jdk-17
%JAVA_HOME%\bin

java -version





C:\Hadoop\hadoop-3.3.6
SPARK_HOME
C:\spark\spark-3.5.7-bin-hadoop3
Path 변수에 등록
%SPARK_HOME%\bin
HADOOP_HOME
C:\Hadoop\hadoop-3.3.6
Path 변수에 등록
%HADOOP_HOME%\bin
pip install pyspark==3.5.7
localhost:4040
https://passwd.tistory.com/entry/Window-Spark-%EC%84%A4%EC%B9%98
https://boring-notes.tistory.com/entry/Spark-Windows-%EC%84%A4%EC%B9%98