java -version

sudo apt install openjdk-8-jre-headless
๋ง์ฝ ์๋ ์ค๋ฅ๊ฐ ๋ฐ์ํ๋ค๋ฉด apt ๋ฒ์ ์ค๋ฅ์ธ๊ฒ์ด๋ค.
E: Unable to locate package openjdk-8-jre-headless
sudo apt update

sudo adduser hdoop
Password๋ง ์ ๋ ฅํด์ฃผ๊ณ ๋๋จธ์ง๋ Enter๋ก ๋๊ฒผ๋ค.
๊ณ์ ์ค์์น
su - hdoop

Hadoop ๊ณ์ ์ด localhost๋ก ๋ก๊ทธ์ธํ ๋ password๊ฐ ํ์ํ์ง ์๋๋ก sshํค๋ฅผ ๋ฑ๋กํด์ผํ๋ค.
ssh ํค ์์ฑ
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

chmod 0600 ~/.ssh/authorized_keys
ssh localhost
Apache
์ค์น์ ์ ๋งํฌ๋ก ๋ค์ด๊ฐ์ hadoop์ ๋ฒ์ ์ ํ์ธํ์
wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz
tar xvf hadoop-3.3.5.tar.gz
์ค์น ํ์ธ

Hadoop๊ณผ ๊ด๊ณ๋ ํ๊ฒฝ๋ณ์๋ฅผ ์ค์ ํด์ฃผ์ด์ผ ํ๋ค.
vi .bashrc
nano .bashrc
export HADOOP_HOME=/home/hdoop/hadoop-3.3.5
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"
source .bashrc
์๋ ๋ง์คํฐํ์ผ์ ์ฌ์ ์ ํด์ฃผ์ด์ผ ํ๋ค.
vi $HADOOP_HOME/etc/hadoop/hadoop-env.sh
nano $HADOOP_HOME/etc/hadoop/hadoop-env.sh
Generic settings for HADOOP ๋ธ๋ญ์ ์ฐพ์์
export JAVA_HOME= ์ ์ฃผ์์ ํ์ด์ฃผ์.
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
๋ค์์ผ๋ก core-site.xml ํ์ผ๋ ์์ ํด์ฃผ์.
vi $HADOOP_HOME/etc/hadoop/core-site.xml
nano $HADOOP_HOME/etc/hadoop/core-site.xml
์๋ ๋ด์ฉ์ ๋ฃ์ด์ฃผ์
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hdoop/tmpdate</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://127.0.0.1:9000</value>
</property>
</configuration>
๋ค์์ผ๋ก hdfs-site.xml์ ์์ ํด์ฃผ์.
vi $HADOOP_HOME/etc/hadoop/hdfs-site.xml
nano $HADOOP_HOME/etc/hadoop/hdfs-site.xml
<configuration>
<property>
<name>dfs.data.dir</name>
<value>/home/hdoop/dfsdata/namenode</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/hdoop/dfsdata/datanode</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
๋ค์์ผ๋ก mapred-site.xml์ ์์ ํด์ฃผ์.
vi $HADOOP_HOME/etc/hadoop/mapred-site.xml
nano $HADOOP_HOME/etc/hadoop/mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
๋ง์ง๋ง์ผ๋ก yarn-site.xml์ ์์ ํด์ฃผ์.
vi $HADOOP_HOME/etc/hadoop/yarn-site.xml
nano $HADOOP_HOME/etc/hadoop/yarn-site.xml
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
</property>
<property>
<name>yarn.acl.enable</name>
<value>0</value>
</property>
<property>
<name>yarn.nodemanager.env-whitelist</name>
<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PERPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
</property>
</configuration>
์ด์ ๋ hdfs๋ฅผ ํฌ๋งทํด์ฃผ์ด์ผํ๋ค.
hdfs namenode -format
dfs ์คํํ๊ณ yarn์ ์คํํด์ผํ๋ค.
cd hadoop-3.3.5/sbin/
./start-dfs.sh
./start-yarn.sh
jdk๋ ์ค์นํ์ง ์์๊ธฐ ๋๋ฌธ์
์์คํ
๋ด๋ถ์ ์๋ java Application์ ๋ณด์ฌ์ฃผ๋ jps ๋ช
๋ น์ด๋ ์คํ๋์ง ์๋๋ค.
jps
jdk๋ฅผ ์ค์นํ๊ธฐ ์ํด์ Ubuntu๋ก ๋์๊ฐ์
exit
jdk์ค์น
sudo apt install openjdk-8-jdk-headless
๋ค์ Hadoop acount๋ก ๋์๊ฐ์
su - hdoop
๋ค์ jps ์คํ
jps
์์ ์ดํด๋ณธ WordCount ํ๋ก๊ทธ๋จ ์คํํด๋ณด๊ธฐ
HDFS ์ ๋ ฅ/์ถ๋ ฅ ์ดํด๋ณด๊ธฐ
ํ๋ก Web UI (Resource Manager)๋ก ์คํ ๊ฒฐ๊ณผ ์ดํด๋ณด๊ธฐ
