Hadoop项目_小白不想白a的博客-CSDN博客

Hadoop项目

关注

文章平均质量分 54

关注数：文章数：7 文章阅读量：4625 文章收藏量：51

作者: 小白不想白a

知者深知自己的无知

展开

专栏收录文章

使用Ansible自动化部署Hadoop集群（含源码）--环境准备

我们的目标是通过Ansible实现自动化部署hadoop集群。在此之前，我们先编写一个shell脚本来配置hadoop集群的环境，包括安装软件、安装配置Ansible（一个主节点+四个工作节点）、实现节点间的免密访问、配置hdfs yarn zookeeper等角色分组，为后续自动化部署hadoop集群做准备。现在我们有5台虚拟机，已经配置好了主机名和网络。

原创 2025-09-06 21:51:36 · 199 阅读 · 0 评论
【Hadoop】Zookeeper、HBase、Sqoop

Zookeeper可以监视HDFS系统的name node和data node，HBase也极度依赖zookeeper，因为zookeeper维护了HBase的源数据以及监控所有region server的健康状态，如果region server宕机会通知master。它也可以避免脑裂（只有一个master大脑）。啊不免，通过分布式锁实现数据的一致性，YARN资源管理也依赖zookeeper，它为YARNresource manager提供节点选举服务。他还管理进入的消息队列。

原创 2025-08-27 23:54:24 · 1353 阅读 · 0 评论
【Hadoop】YARN、离线计算框架MapReduce、Hive

RM会根据节点资源使用情况找一个节点运行AM，然后AM将自己的任务和资源请求汇报给RM，RM就会在各个节点创建任务、分配资源，然后AM可以直接与节点上的NM通信，监督资源的完成状况，AM也会定期向RM发送心跳。Task失败后NM会将失败的任务告诉AM，AM决定如何处理失败的任务。Task失败后NM会将失败的任务告诉AM，AM决定如何处理失败的任务。RM收不到NM的心跳，会像AM报告，AM找新的节点运行失败的任务。RM收不到NM的心跳，会像AM报告，AM找新的节点运行失败的任务。client向RM提交。

原创 2025-08-27 00:31:08 · 588 阅读 · 0 评论
【Hadoop】HDFS 分布式存储系统

HDFS不适合保存小文件。一个k和一个t数据块的元数据大小是相同的，元数据会存储在namenode，但namenode内存是有限的。Secondary namenode是namenode的热备，当active namenode出现故障时，快速切换为新的active namenode。Namenode是整个HDFS文件系统的前端，只有一个，管理数据块映射信息，配置副本策略，处理客户端的读写请求。文件被切分成数据块，分布存储，默认情况下每个块有三个副本。Datanode有多个，存储数据块，执行数据块读写。

原创 2025-08-25 23:18:47 · 944 阅读 · 0 评论
Hadoop集群的安装与配置(详细)

：设置 Java 路径、日志目录、配置文件目录等基础环境变量。

原创 2025-08-19 09:30:00 · 1114 阅读 · 0 评论
克隆虚拟机后如何重新配置网络

关闭虚拟机电源>右键已创建好的虚拟机>管理>克隆>下一步>下一步>创建完整克隆>修改虚拟机名称>选择存储位置>完成。要删除虚拟机，右键从磁盘删除。

原创 2025-08-18 15:46:37 · 91 阅读 · 0 评论
Hadoop集群配置SSH

然后分别在其他机子执行，最后执行完后，就能在所有机子上的~/.ssh 目录下看到保存的其他主机的公钥。现在就能在hadoop2和hadoop3无密码登录hadoop1了。现在有三台机子 hadoop1、hadoop2、hadoop3。在家目录ll -a就能看到隐藏目录.ssh 其中保存了公私钥。然后执行以下命令，将公钥发送给hadoop2和hadoop3。首先在hadoop1上执行以下命令生成公私密钥。

原创 2025-08-18 17:09:21 · 346 阅读 · 0 评论

Hadoop项目

作者: 小白不想白a

使用Ansible自动化部署Hadoop集群（含源码）--环境准备

【Hadoop】Zookeeper、HBase、Sqoop

【Hadoop】YARN、离线计算框架MapReduce、Hive

【Hadoop】HDFS 分布式存储系统

Hadoop集群的安装与配置(详细)

克隆虚拟机后如何重新配置网络

Hadoop集群配置SSH