干了十几年自动化系统维护,我最怕的不是设备坏,而是那句:“李工!网络又断了!”
一群人围在电柜前,手忙脚乱拔网线、重启工业交换机,结果越搞越乱。
今天,我不讲高深理论,就掏心窝子分享一套我在现场总结出的——工业网络故障排查“望闻问切”四步法。

这可不是中医玄学,是实打实的电子工程师“排雷”经验,帮你从“救火队员”升级为“网络神探”。
第一步:望——先看再动,5分钟锁定大方向
记住:故障发生时,第一个动作不是重启,而是“观察”。
看指示灯:
工业交换机每个端口都有状态灯。绿灯常亮=链路通,闪烁=有数据。
灯不亮?查网线、对端设备供电。
灯狂闪不停(非正常数据流)?小心!可能是广播风暴或环路征兆。
问操作员:
别急着查设备,先问清楚:
是整条线断,还是某个工位?
故障前有没有人动过设备或接新终端?
这些信息能帮你判断是全局性故障还是局部问题,少走80%弯路。
登录管理界面:
如果还能连上,立刻打开交换机Web页面(比如邮科这类网管型设备)。
看CPU/内存占用率(持续>80%要警惕),查系统日志(Log),里面常有“端口DOWN”、“环路告警”等关键线索。
第二步:闻——用工具“听”网络的“心跳”
这里的“闻”,是用Ping命令做网络“听诊器”。
从核心开始Ping:PLC → 汇聚交换机 → 上位机。
哪一跳不通,问题就出在哪一段。
用 ping 192.168.1.1 -t 持续测试,观察丢包率和延迟。
工业网络延迟应<100ms,持续丢包说明链路不稳定。
分段排查更高效:
整网段不通?重点查汇聚层交换机的VLAN和网关配置。
单台设备失联?直奔它连接的接入层交换机端口。
第三步:问——向设备“问话”,揪出真凶
定位到可疑交换机后,用命令行“问”它真相。
查MAC地址表:
输入 show mac address-table。
如果发现一个MAC地址在多个端口间“漂移”,99%是网络环路——多半是有人私接了普通交换机或路由器。
看端口错误计数:
查故障端口的统计信息。
大量CRC错误?网线破损、屏蔽不良或超距离传输。
高碰撞冲突?半双工模式或线路干扰。
核对关键配置:
VLAN划分、QoS策略、环网协议(如ERPS)是否被误改?
尤其是Trunk口的VLAN允许列表,少加一个,设备就“失联”。
第四步:切——动手解决,手到“病”除
找到根因,果断处理:
网线问题?换线、换端口。
配置错误?恢复备份或重配。
环路?拔掉私接设备,启用端口环路检测。
广播风暴?开启风暴抑制功能,限制异常流量。
最后一句忠告:动配置前,先备份!
就像手术前拍CT,对工业交换机做一次配置导出备份,是每个工程师的基本职业素养。别让一次误操作,把小故障变成大事故。
——来自一位刚处理完夜班故障,还没来得及脱工装的“老电工”