이 분의 블로그를 많이 보면서 활용했다! 아무래도 맥북이다 보니 제한사항이 많다보니
brew install hadoop
으로 하둡을 설치해준다.
brew info hadoop
==> hadoop: stable 3.4.0 (bottled)
Framework for distributed processing of large data sets
https://hadoop.apache.org/
Conflicts with:
corepack (because both install `yarn` binaries)
yarn (because both install `yarn` binaries)
/opt/homebrew/Cellar/hadoop/3.4.0 (20,205 files, 1.3GB) *
Poured from bottle using the formulae.brew.sh API on 2024-03-22 at 17:30:26
From: https://github.com/Homebrew/homebrew-core/blob/HEAD/Formula/h/hadoop.rb
License: Apache-2.0
==> Dependencies
Required: openjdk@11 ✔
==> Analytics
install: 1,386 (30 days), 2,986 (90 days), 10,869 (365 days)
install-on-request: 1,260 (30 days), 2,601 (90 days), 9,268 (365 days)
build-error: 0 (30 days)
이런식으로 설치가 된걸 확인할 수 있다.
cd /opt/homebrew/Cellar/hadoop/3.4.0/libexec/etc/hadoop ##디렉토리 이동후
nano hadoop-env.sh ## 후
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk-11.jdk/Contents/Home
## 자바 버전에 맞게 작성해줍니다!
맥에 적응을 못 하여 자바 설치하고 경로 잡아주는 부분이 가장 애를 먹었다.
총 4가지 파일에 내용을 붙여준다.
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.application.classpath</name>
<value
>$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/*:$HADOOP_MAPRED_HOME/share/h$
>
</property>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
ssh localhost. # 로컬호스트로 접속
cd /opt/homebrew/Cellar/hadoop/3.4.0/libexec #폴더 이동 후
sbin/start-dfs.sh
sbin/start-yarn.sh #로 시작할 수 있다
#종료하는건 반대로
sbin/stop-dfs.sh
sbin/stop-yarn.sh
시작하고
localhost:9870 에 들어가면 각각 화면을 볼 수 있다.


이 표를 해석해보자면
일단 기본적인 하둡 구성만 해보았고 다음엔 간단한 데이터를 직접 넣어보려고 한다