State: Complete
최종 편집: 2021년 10월 29일 오전 11:48
Hortonworks HDP는 아파치에서 제공하는 Hadoop관련 프로젝트들을 하나의 가상 이미지로 묶은 것으로, 각 툴들을직접 설치하는 과정과 시간을 획기적으로 줄일 수 있다.
링크를 통해 Cloudera 홈페이지에서 이미지를 다운 받을 수 있다. 버츄얼 박스 등의 가상머신 이미지 혹은 도커 이미지를 사용하면 될 것 같다. 나는 도커를 사용하기로 했다.
그리고 최신 버전은 3.0.1인데, 요구하는 최소 메모리가 상당해서 이전 버전인 2.6.5로 선택했다. 이것도 최소 10G의 메모리를 요구한다.
2.6.5 버전에 기본 보함된 프로젝트들이다.
도커는 윈도우에서도 설치해봤고, 리눅스에서도 해봤다.
Install Docker Desktop on Windows Documents
공식 Document가 잘 설명해주고 있기 때문에 설치에는 문제가 없다. 이번에는 윈도우 환경에서 사용할 예정이다. 또한 bash shell 사용을 위해 Power Shell을 쓸 수도 있지만 WSL을 유용하게 써왔기 때문에 이번에도 쓸 것이다.
위의 링크에서 sandbox 설치 파일을 받으면 압축 파일에 쉘 스크립트가 들어있다.
이 중에서 docker-deploay-{VERSION}.sh
를 실행해주면 된다.
bash ./docker-deploy-hdp265.sh
(설치 완료 후 적는 글이라 설치과정은 생략)
설치가 완료되면 컨테이너 2개가 실행되는 쉘 스크립트이다.
sandbox-proxy
라는 컨테이너와 sandbox-hdp
라는 컨테이너 2개가 실행되게 된다.
마지막으로 hosts 파일을 수정해준다
echo '127.0.0.1 sandbox-hdp.hortonworks.com sandbox-hdf.hortonworks.com' | sudo tee -a /etc/hosts
이제 127.0.0.1:1080
으로 접속하면
이러한 페이지를 볼 수 있고 왼쪽의 LAUNCH DASHBOARD를 누르면 된다. 그러면 로그인을 해야하는데,
출처: https://www.bearpooh.com/80
이러한 계정들이 있다고한다. 아직 각각의 기능에 대해서는 모르겠다.
Deploying Hortonworks Sandbox on Docker
The Ultimate Hands-On Hadoop: Tame your Big Data! —>installing hadoop 미리보기