시작하기 Apache Spark with Docker

박성현·2024년 6월 2일

pySpark

목록 보기
1/17

docker run -it --rm -p 8888:8888 -v /Users/ben/pyspark:/home/jovyan/work jupyter/pyspark-notebook

docker run -it --rm -p 8888:8888 -v D:\pyspark:/home/jovyan/work jupyter/pyspark-notebook

-it: 컨테이너에 터미널을 연결하여 인터랙티브하게 사용할 수 있게 합니다.
--rm: 컨테이너 종료 시 자동으로 삭제합니다.
-p 8888:8888: 호스트 시스템의 8888 포트를 컨테이너의 8888 포트에 연결합니다. 이를 통해 브라우저에서 http://localhost:8888로 접속하여 Jupyter Notebook을 사용할 수 있습니다.
-v /Users/ben/pyspark:/home/jovyan/work: 호스트 시스템의 /Users/ben/pyspark 디렉토리를 컨테이너의 /home/jovyan/work 디렉토리에 마운트합니다. 이렇게 하면 호스트 시스템에서 작성한 PySpark 코드를 컨테이너 안에서도 사용하고 변경 사항을 저장할 수 있습니다.
jupyter/pyspark-notebook: PySpark와 Jupyter Notebook이 미리 설치되어 있는 Docker 이미지 이름입니다.

profile
다소Good한 데이터 엔지니어

0개의 댓글