<property>
<name>dfs.client.use.datanode.hostname</name>
<value>true</value>
</property>
spark = SparkSession.builder.master('local')\
.config("spark.hadoop.dfs.client.use.datanode.hostname", "true")\
.getOrCreate()
이렇게 해두면 spark에서 namenode 접근하여 데이터 요청 시, datanode의 서버 정보를 hostname으로 받을 수 있다.
etc/hosts 정보를 해당 hostname으로 바꿔서 사용하면 됨