11.1.3hadoop工具dfsadmin、fsck、数据库扫描器、均衡器

本文详细介绍HDFS的管理工具,包括dfsadmin控制工具的功能,如查看状态、切换安全模式等;fsck工具用于检测文件系统健康,统计文件、数据块信息;数据块扫描器定期检查datanode上的损坏块;均衡器调整数据块分布,确保各节点负载均衡。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

(1)   dfsadmin管理控制工具

查看hdfs的状态,切换安全模式,保存新的fsimage镜像,重置edits文件等

 

 

 

 

 

 

(2)   fsck工具(file system check

fsck工具从namenode获取文件系统的信息,检测文件系统总字节数,文件夹数,文件数,数据块数,满足最小复制条件的数据块数。超过3个复本的数据块,少于3个复本的数据块等。

 

 

 

移动文件到hdfs的/lost+found目录,hdfs fsck –move

删除文件无法恢复 hdfs fsck –delete

查找文属性件hdfs fsck /user/tom/part-00007 –files –blocks –racks

-files

显示文件的名称,字节数,块数量,健康状态(是否有块丢失)。/user/tom/part-00007 234342342 bytes 1blocks(s):OK

-blocks

显示文件中各个数据块的信息,每个块一行

Blk_341423413131213 len=3432434 repl=3

-racks

显示各个数据块复本在机架中的位置和datanode的地址

[/default-rack/10.3.23.1:50010, /default-rack/10.3.23.2:50010, /default-rack/10.3.23.3:50010,

(3)   数据块datanode扫描器

属性dfs.datanode.scan.period.hours设置扫描周期,默认三周(504小时)检查一次。各个datanode扫描损坏数据块,进行检查。通过网页http://datanode:50075/blockScannerReport来获取输出报告。加上http://datanode:50075/blockScannerReport?Listblocks会在报告中列出datanode上所有块的最新状态。ok表示正常,failed表示损坏。

 

 

 

(4)   均衡器

随着时间的推移各个datanode上块分布会越来越不均衡,有忙有闲,有多有少。执行start –balancer.sh –threshold 5%脚本启动均衡器,复制数据库,使得各个datanode节点的使用率和集群的使用率之间小于阈值时5%(默认10%),停止均衡器。复制数据库的带宽限制由属性dfs,datanode.balance.bandwidthPerSec属性设定。

自己开发了一个股票智能分析软件,功能很强大,需要的点击下面的链接获取:

https://www.cnblogs.com/bclshuai/p/11380657.html

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

bclshuai

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值