前言
如果读者是刚接触大数据,那么在阅读本章前,请先阅读下上一篇文章《前戏》会比较容易理解。本章主要讲解如何配置HDFS。
编辑core-site.xml
我编辑的路径是在/home/kfk/hadoop-2.8.0/etc/hadoop/core-site.xml
fs.defaultFS
hdfs://bigdata-pro01.kfk.com:9050
hadoop.tmp.dir
/home/kfk/hadoop-2.8.0/data/tmp
fs.defalultFS
这个是用来配置是否配置为分布式的文件系统。hdfs://用来指明是分布式系统,bigdata-pro01.kfk.com是主机名,9050是端口号,默认是9000,但由于9000和我的python使用的端口冲突了,所以我将9000改成了9050。使用端口的原则不与其他进程冲突。
hadoop.tmp.dir
这个配置临时目录,建议是放到kfk用户的目录下。
格式化
/home/kfk/hadoop-2.8.0/bin/hdfs namenode -format
namenode启动
/home/kfk/hadoop-2.8.0/sbin/