本人只是简单的写了一下从 VM 到hbase整个集群的安装过程,不解释其中的原理。整个过程亲自实践,Pass
若果有问题可以反馈到我的邮箱或者QQ 大家集体研究哈
我也只是hadoop的初学者 只是看到很多书上的安装步骤总会出现各种问题(权限问题)
所以根据自己的环境写了这么一个安装过程
希望大家支持。
谢谢
本文是一篇关于Hadoop虚拟机集群搭建的详细教程,作者王志乾是黑龙江大学信息科学与技术学院的学生。由于作者在实践中发现许多书籍中的安装步骤存在一些问题,尤其是权限问题,所以作者根据个人的环境总结出了一套安装流程,并分享了从VMware虚拟机环境到HBase集群搭建的整个过程,但没有深入解释每个步骤的原理。文档中还提到了一些常用的软件和插件的版本和下载链接,以供建立开发环境时使用。
知识点包括以下方面:
1. VMware的安装:
VMware是一种虚拟机软件,允许用户在同一台物理主机上运行多个操作系统实例。作者提到在安装VMware时会涉及到安装路径的选择以及可能需要的序列号。VMware的安装包括运行安装程序、选择典型安装、改变安装路径、选择安装类型、接受许可协议、输入序列号(如果需要)、选择安装组件以及完成安装等步骤。
2. Ubuntu系统的安装:
Ubuntu是一个流行的Linux发行版。在虚拟机中安装Ubuntu包括创建新的虚拟机、选择安装介质、配置虚拟机参数、启动虚拟机、设置语言和位置、创建用户账户等步骤。
3. 安装JDK(Java Development Kit):
Java是Hadoop的运行环境之一。JDK的安装涉及到解压安装包、配置环境变量以及验证安装是否成功。
4. 安装SSH并配置免密码登陆:
SSH(Secure Shell)用于远程登录和远程命令执行。免密码登陆是一种便捷的安全配置方法,通过生成和交换公钥和私钥实现无需密码即可登录到远程服务器。
5. 安装Hadoop:
Hadoop是一个开源框架,允许在集群上使用简单的编程模型进行大数据处理。安装Hadoop包括下载并解压Hadoop的二进制包,并设置必要的配置文件来完成安装。
6. 搭建Hadoop集群环境:
这一步涉及配置Hadoop的核心文件,如`hdfs-site.xml`、`core-site.xml`、`mapred-site.xml`和`yarn-site.xml`,以确保Hadoop集群按照预期方式运行。
7. Eclipse集成开发环境的安装和配置:
Eclipse是一个流行的集成开发环境,用于Java等语言的开发。安装Eclipse涉及下载并解压Eclipse的压缩包。安装hadoop-eclipse-plugin允许开发者在Eclipse中可视化地管理Hadoop的HDFS(Hadoop分布式文件系统)。
8. 安装Zookeeper:
Zookeeper是一个开源的分布式协调服务,Hadoop使用Zookeeper来进行协调。安装Zookeeper包括下载并解压Zookeeper包,并对配置文件进行必要的修改以适配个人环境。
9. 安装HBase:
HBase是一个开源的非关系型分布式数据库,构建在Hadoop之上,用于实时地进行随机读写访问。安装HBase包括下载HBase包,解压,并进行一些配置来设置HBase运行环境。
除了上述步骤之外,作者还提供了相关的软件资源链接,以方便读者获取所需的安装包和插件,确保每个步骤的正确执行。
作者在文档中还提出了自己的学习背景,并鼓励读者在遇到问题时通过邮箱或QQ进行反馈,以便集体研究和解决。作者强调了自己作为一个Hadoop初学者的立场,但仍然希望本文能够得到读者的支持和理解。