
运维常见问题
文章平均质量分 56
白-胖-子
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【生产实践】Linux中NAS挂载丢失后提示“过旧的文件句柄”错误解决
摘要:当NAS服务器意外重启导致Linux客户端挂载点失效时,会出现"stale file handle"错误。这是由于内核保留的旧文件句柄与实际存储状态不一致造成的。解决方法包括:1)强制卸载旧挂载点(umount -lf);2)重新执行挂载命令。预防措施建议使用autofs实现自动挂载或部署监控脚本自动修复。理解Linux挂载机制和文件句柄管理是解决此类问题的关键。原创 2025-07-17 16:14:51 · 766 阅读 · 0 评论 -
【生产实践】Linux中DNS配置方法、原理及优先级详解
快速配置Linux DNS方法: 直接修改/etc/resolv.conf文件,添加DNS服务器(如114.114.114.114和8.8.8.8) 测试网络连通性(ping csdn.net) 备份配置文件并设置cron任务防止重启失效 详细说明: Linux DNS配置主要通过/etc/resolv.conf、/etc/hosts等文件实现,现代系统多使用NetworkManager或systemd-resolved管理。配置时需注意不同方法的优先级和持久性,手动修改可能被网络管理工具覆盖。域名解析遵循原创 2025-07-08 11:11:27 · 1114 阅读 · 0 评论 -
【生产实践】SSH服务弱加密算法修复指南(附完整操作流程)
SSH服务弱加密算法漏洞修复方案 检测发现SSH服务存在支持弱加密算法漏洞,主要风险包括: 使用arcfour、aes128-cbc等易被破解的算法 面临密钥恢复、重放攻击等安全威胁 提供两种修复方案: 推荐方案:升级OpenSSH至最新版本 替代方案:修改SSH配置禁用弱算法(需注意可能影响旧客户端连接) 修复步骤: 编辑/etc/ssh/sshd_config 注释或删除弱算法配置 添加强加密算法(如aes128-ctr等) 重启SSH服务 注意事项: 建议先在测试环境验证 可能需配合客户端升级 操作前原创 2025-07-07 09:57:44 · 859 阅读 · 0 评论 -
【生产实践】安装JDK后不生效,Java环境变量配置错误排查与修复指南
本文总结了Linux系统中配置Java环境变量时常见的问题及解决方案。主要错误包括PATH变量未包含Java路径、路径优先级冲突、配置未生效等。文章提供了修正后的环境变量配置方案,强调将Java路径置于PATH变量开头,并给出验证步骤。同时介绍了多版本JDK管理和容器化环境配置的高级场景,最后总结了配置的关键原则和预防措施。通过正确的环境变量设置和验证流程,可彻底解决Java命令失效问题。原创 2025-06-26 09:29:47 · 1025 阅读 · 0 评论 -
【生产实践】深度剖析 RHEL7.9 SSH 连接故障:从权限异常到服务恢复的系统性排查与修复
SSH连接故障排查摘要: 服务器能ping通但无法SSH连接,检查发现sshd服务异常。关键报错显示/etc/ssh/ssh_host_ed25519_key文件权限0640不符合安全要求(应≤600)。解决方案是将该文件权限改为600后重启sshd服务。建议建立定期权限检查机制,并加强运维操作规范,避免类似问题发生。原创 2025-06-16 15:29:30 · 815 阅读 · 0 评论 -
【生产实践】DolphinScheduler集群MySQL数据源切换终极指南|附生产环境避坑手册
DolphinScheduler数据库切换简明指南 修改配置文件 vim /app/dolphinscheduler/conf/evn/dolphinscheduler-env.sh 添加: export SPRING_DATASOURCE_URL="jdbc:mysql://:3306/?characterEncoding=UTF-8&allowMultiQueries=true" export SPRING_DATASOURCE_USERNAME="" export SPRING_DATASOURCE_原创 2025-06-12 15:52:02 · 728 阅读 · 0 评论 -
【生产实践】Kibana控制台暴露风险:Nginx反向代理+权限控制实战方案(附避坑指南)
本文介绍Kibana数据暴露风险及安全防护方案。Kibana若未做认证直接暴露公网,将面临数据泄露、ES集群沦陷等风险。核心解决方案采用Nginx反向代理,结合HTTP Basic认证、IP白名单和HTTPS加密构建三层防护。具体实施步骤包括:安装Nginx与认证工具、生成密码文件、配置反向代理、限制本地端口访问、启用ES X-Pack认证等。文章还提供进阶优化策略如动态黑名单、性能调优参数,以及常见问题排查方法。该方案通过多重安全措施,有效防止未授权访问,确保Kibana数据安全。原创 2025-05-28 14:52:02 · 1007 阅读 · 0 评论 -
【生产实践】Windows Server 2012 MPIO多路径配置操作手册
摘要: MPIO是微软提供的多路径存储框架,支持高可用和负载均衡。核心组件包括MPIO驱动、厂商DSM模块和PowerShell管理工具。配置流程涵盖安装功能、添加设备(支持iSCSI/FC/SAS)、设置负载均衡策略(如轮询或故障转移)及故障回切。高级管理可通过PowerShell实现自动化,性能优化需调整路径验证周期等参数。常见问题排查包括路径状态异常检测和策略验证。MPIO显著提升存储可靠性,需结合厂商DSM实现最佳性能。原创 2025-05-26 14:06:24 · 1237 阅读 · 0 评论 -
【生产实践】Windows Server 2019 磁盘管理中 MPIO 选项不可用问题处理操作文档
摘要: 在Windows Server 2019中,微软移除了磁盘管理中的MPIO图形配置选项,改用PowerShell管理多路径I/O功能。用户需通过PowerShell命令验证MPIO安装状态(Get-WindowsFeature Multipath-IO)、配置负载均衡策略(如Set-MSDSMGlobalDefaultLoadBalancePolicy -Policy RR)及检查路径状态(Get-MSDSMPath)。该方法提升了管理的一致性和自动化能力,但需确保存储设备兼容性并进行故障测试。原创 2025-05-26 10:46:15 · 1102 阅读 · 0 评论 -
【生产实践】 新华三(3PARdata)存储在RHEL 7.0 - 7.3上的多路径配置操作手册(生产环境)
本手册详细介绍了RHEL 7.0-7.3系统与新华三3PAR存储(VV系列)的多路径配置方案。通过配置ALUA角色2实现高可用性和负载均衡,包括关键参数设置(如轮询间隔10秒、路径分组策略、故障快速检测等)。提供了完整的配置文件模板和验证方法,并给出生产环境最佳实践建议,如硬件冗余架构、固件升级、监控告警等。最后针对常见故障(路径识别、负载不均等)提供了排查方案。该配置可实现99.99%可用性,但需注意与存储型号和固件版本的兼容性。原创 2025-05-26 10:23:16 · 938 阅读 · 0 评论 -
【生产实践】华为存储XSG1在RHEL 7.x/8.x上的多路径配置操作手册(生产环境)
本文档详细介绍了在Red Hat Enterprise Linux 7.x/8.x系统中配置华为XSG1存储设备多路径I/O(MPIO)的方法。主要内容包括:关键参数解析(如设备标识、路径分组策略、优先级设置和故障处理机制)、具体配置步骤(编辑配置文件、重启服务及验证操作)、最佳实践建议(硬件冗余、固件更新等)以及常见故障排除方案。通过优化路径策略,实现高可用、负载均衡和故障容错,确保生产环境99.99%的可用性。配置需结合华为存储特性和RHEL版本进行适配,并建议定期演练验证。原创 2025-05-26 10:02:24 · 994 阅读 · 0 评论 -
【生产实践】NetApp存储多路径I/O(MPIO)配置操作手册(生产环境)
本文详细介绍了Linux系统与NetApp存储设备的多路径I/O(MPIO)配置方案。主要内容包括:路径检测与优先级设置、故障处理与容错机制、路径管理策略、设备与供应商适配参数,以及高级特性配置。文章提供了完整的配置文件示例和详细的生产环境部署步骤,强调硬件冗余、固件更新等最佳实践,并给出故障排查方法。通过优化参数配置,可实现存储访问的高可用性、负载均衡和故障容错,满足关键业务对存储冗余的高要求。原创 2025-05-26 09:56:22 · 1009 阅读 · 0 评论 -
Linux服务器远程文件传输终极指南:SCP/Rsync/cURL/Wget深度对比与实战技巧
在 Linux 服务器运维中,远程文件传输是高频核心操作。从单文件安全传输到 TB 级数据同步,从 API 接口交互到整站资源抓取,不同场景对工具的协议支持、传输效率、安全性提出了差异化需求。本文通过协议原理剖析 + 实战命令演示 + 场景化选型指南,助你精准匹配最优方案,避免因工具选择不当导致的效率损耗或安全风险。原创 2025-05-22 14:15:38 · 1142 阅读 · 0 评论 -
Linux服务器SOS Report完全指南:收集方法、作用解析与最佳实践
SOS Report是Linux系统运维中强大的诊断工具,能自动收集200+项系统数据(配置、日志、性能等),大幅提升故障排查效率。文章详细介绍了其安装方法(支持主流Linux发行版)、核心参数定制收集内容、基础到高级的实战用法,并阐述了它作为标准化信息收集工具的价值——加速故障处理、支持合规审计。最佳实践包括敏感信息处理、大文件优化等注意事项,建议将其纳入日常运维流程。通过sudo sosreport命令即可生成全面的系统体检报告,是运维工程师不可或缺的得力助手。<|end▁of▁sentence|原创 2025-05-21 17:42:13 · 924 阅读 · 0 评论 -
互联网技术岗位职责与专用工具对照表(2025年行业标准)
本文概述了不同IT岗位的核心职责及专用工具。系统运维工程师负责服务器和网络设备的安装、监控与故障排查,常用工具包括Xshell、Zabbix等。软件开发工程师进行需求分析、代码编写与调试,使用VS Code、Docker等工具。测试工程师负责功能测试与自动化脚本开发,常用Selenium、JMeter等。数据库工程师进行数据库设计与性能调优,使用Navicat、Percona Toolkit等。网络安全工程师配置防火墙策略与进行渗透测试,使用Wireshark、Metasploit等。DevOps工程师搭建原创 2025-05-14 15:39:56 · 531 阅读 · 0 评论 -
【生产实践】Dolphinscheduler集群部署后Web控制台不能登录问题解决
摘要:本文介绍了Dolphinscheduler集群部署后Web控制台登录失败问题解决详细过程原创 2025-05-14 14:25:04 · 1044 阅读 · 0 评论 -
【生产实践】Linux中/usr/bin、/usr/sbin与/usr/local的关系解析(2025年技术规范)
Linux系统中的/usr/bin、/usr/sbin和/usr/local目录分别承担不同的功能,形成了系统与用户软件的分层管理。/usr/bin存储用户级通用命令,所有用户均可执行;/usr/sbin存放需要管理员权限的系统管理工具;/usr/local则用于用户自定义软件的安装,避免与系统软件冲突。通过环境变量PATH的优先级设置,用户自定义软件可以覆盖系统默认版本。设计上,系统与用户软件分离,确保系统升级时不影响用户自定义程序。最佳实践包括避免手动修改系统目录、使用符号链接以及合理配置环境变量。这种原创 2025-05-12 11:31:37 · 1381 阅读 · 0 评论 -
Linux中手动安装7-Zip软件文档
Linux中手动安装7-zip技术文档原创 2025-04-21 09:55:38 · 1344 阅读 · 0 评论 -
【经验分享】从YUM源下载已安装软件RPM包操作手册
适用场景:已配置YUM源的Linux服务器(如CentOS/RHEL 7.9),需重新下载已安装软件的RPM包(如),用于备份、离线部署或版本验证。更新YUM缓存(确保元数据最新):2. 安装必要工具(可选)若需使用高级功能(如批量下载依赖):二、下载已安装软件RPM包的核心方法方法1:使用原理:通过参数仅下载RPM包,不执行安装操作。参数说明::指定RPM包保存路径(如)。默认保存路径:未指定时,包存放于。依赖处理:自动下载主包及依赖项(需确保内网源包含完整依赖)。原创 2025-03-11 10:05:35 · 1552 阅读 · 0 评论 -
【经验分享】Linux 系统安装后内核参数优化
在 Linux 系统安装后,进行内核优化有助于提升系统的性能、稳定性和安全性。以下是一些常见的内核优化操作:修改/etc/sysctl.conf 文件执行sysctl -p使配置生效。以下是对这些。原创 2025-02-11 15:13:26 · 1339 阅读 · 0 评论 -
【疑难杂症】记一次VSFTP因共享目录为NAS挂载点致使用户无法下载文件的问题解决
【代码】【疑难杂症】记一次VSFTP因共享目录为NAS挂载点致使用户无法下载文件的问题解决。原创 2025-02-07 16:34:30 · 415 阅读 · 0 评论 -
【原创分享】Chronyc时间同步参数详解
在这个例子中,Reach 值是 377(二进制表示为 101111001),表示在最近的 8 个轮询周期中,有 7 个周期成功接收到了服务器的响应(从左到右数,最后一位代表最近的轮询周期,1 表示成功,0 表示失败)。这表示客户端的时钟相对于服务器时钟快了 13 微秒(us),估计的误差范围是 +18us 到 -18us(但由于是正偏移,所以只考虑了正方向),并且长期稳定性(或称为“抖动”)导致的最大可能偏移量是 +/- 1118us。: 这一列显示了 NTP 服务器的层级(或称为“跳跃数”)。原创 2024-11-12 10:17:27 · 715 阅读 · 0 评论 -
【原创分享】Linux系统中释放内存的方法
在Linux系统中,释放内存可以通过多种方法来实现。原创 2024-10-31 13:50:49 · 2861 阅读 · 0 评论 -
【原创分享】JVM服务调优实战
【代码】【原创分享】JVM服务调优实战。原创 2024-10-31 13:43:03 · 428 阅读 · 0 评论 -
【生产实测有效】Windows命令行查看激活状态脚本
【代码】【生产实测有效】Windows命令行查看激活状态脚本。原创 2024-02-13 11:49:25 · 926 阅读 · 0 评论 -
【生产实测有效】Linux利用rsync快速删除大量文件
【代码】【生产实测有效】Linux利用rsync快速删除大量文件。原创 2024-02-13 11:42:40 · 1026 阅读 · 0 评论 -
【生产实测有效】linux通过ps叠加awk命令实现进程内存统计
【代码】【生产实测有效】linux通过ps叠加awk命令实现进程内存统计。原创 2024-02-13 11:38:58 · 649 阅读 · 0 评论 -
【生产实测有效】Linux磁盘清理常用命令
【代码】【生产实测有效】Linux磁盘清理常用命令。原创 2024-02-13 11:35:23 · 943 阅读 · 0 评论 -
【生产实测可用】Redis修改集群弱口令
【代码】【生产实测可用】Redis修改集群弱口令。原创 2024-02-13 11:25:13 · 1058 阅读 · 0 评论 -
生产环境一次Linux时钟同步无法正常同步的问题
最后修改配置文件发现需要在时间服务器后边加上iburst。有三台服务器时间不准,重启chronyd服务后就好了。还有一台说啥都和时间服务器差4秒,重启服务也不管用。原创 2023-10-11 21:37:20 · 3516 阅读 · 0 评论 -
Linux利用sed批量自动化更换IP
需求30台服务器跨网段更换IP地址IP地址连续原IP 10.0.0.196~225新IP 10.0.1.51~81需求分析既然IP地址是连续的,就可以用本机IP加上或者减去一个固定的常量用来替换IP实践获取本机IP[root@C8-196 ~]# ifconfig eth0 | awk '/netmask/{print $2}'10.0.0.196利用本机IP计算出替换后的IP前缀可以直接替换,但最末尾主机位的地址要想办法自动生成通过计算对相同常量进行加减即可得到目标I原创 2022-03-18 00:25:00 · 5036 阅读 · 0 评论 -
Linux取ip地址
Linux花式取ip使用hostname -I取出的IP后面会有一个空格[root@centos8 ~]#hostname -I | cat -A10.0.0.8 $通常我们直接从ifconfig中取ip地址更准确利用grep配合grep取ip地址[root@C8-196 ~]# ifconfig | grep -w 'inet' | grep -v 127 |awk '{print $2}'10.0.0.196利用sed配合awk直接过滤取ip地址[root@C8-196原创 2022-03-17 23:16:05 · 8343 阅读 · 2 评论 -
写shell脚本的一种开头方式,给你的脚本加个保险
shell脚本这种解释性语言的程序通常在执行的时候会跳过报错的语句继续往下执行我们使用set -e确保在脚本发生错误的第一时间就停下,以免发生后边不可挽回的结果所以在一个shell脚本的开头,尤其是测试阶段,我们通常可以加上以下字段set -e[ -n "$SUNTEST_DEBUG" ] && set -x脚本只要发生错误,就终止执行。set -e根据返回值来判断一个命令是否运行失败。写脚本的时候要注意,如果需用用到返回值来进行其他判断,则使用set -e来推出程.原创 2021-10-26 10:05:47 · 495 阅读 · 0 评论 -
ubuntu和centos创建用户的区别
在CentOS下习惯使用使用useradd进行用户的创建,但是ubuntu下,如果单纯使用useradd进行用户创建,则不会自动生成该用户的home目录和邮箱之类的。在ubuntu下使用adduser进行用户创建,会进入交互模式,可同时对用户进行多种信息的录入CentOS useradd创建用户默认创建用户家目录默认 shell 解释器为 bash免交互创建密码–stdinUbuntu useradd创建用户默认不创建用户家目录默认 shell 解释器为 sh免交互创建密码 c..原创 2021-10-21 09:45:29 · 411 阅读 · 0 评论 -
Nginx常见优化项和优化参数设置详解
优化Ngxin提高安全性实现高并发通过对Nginx的优化设置,使Nginx提高安全性的同时支持更多并发请求过通对Nginx所在宿主机Linux内核参数进行调整,使其更符合用于支持高并发访问的Web服务器Nginx配置优化编辑nginx.conf配置文件设置nginx多进程通过设置nginx工作进程数量,可以实现更⾼的并发量worker_processes 8; #启动工作进程数数量,建议设置成cpu逻辑核数相同值设置nginx单个工作进程最大并发连接数worker_connec原创 2021-09-10 00:57:12 · 2633 阅读 · 0 评论 -
Linux内核TCP参数优化
配置TCP优化编辑文件/etc/sysctl.conf,加入以下内容:然后执行 sysctl -p 让参数生效。net.ipv4.tcp_fin_timeout = 2net.ipv4.tcp_tw_reuse = 1net.ipv4.tcp_tw_recycle = 1net.ipv4.tcp_syncookies = 1net.ipv4.tcp_keepalive_time = 600net.ipv4.ip_local_port_range = 2000 65000net.ipv4.tc原创 2021-09-07 13:23:48 · 779 阅读 · 0 评论 -
Linux查看当前系统TCP连接数命令
netstat -n | awk '/^tcp/ {++S[$NF]} END{for(a in S) print a,S[a]}'LAST_ACK 14SYN_RECV 348ESTABLISHED 70FIN_WAIT1 229FIN_WAIT2 30CLOSING 33TIME_WAIT 18122最主要监控SYN_RECV和ESTABLISHEDLAST_ACK:等待原来的发向远程TCP的连接中断请求的确认-SYN_RECV:一个连接请求已经到达,等待确认ESTABLISH原创 2021-09-07 13:19:23 · 2274 阅读 · 0 评论 -
Linux脚本编程Shell中关于 () 和 {}的区别
小括号和花括号的作用在bash中,小括号(CMD1;CMD2;…)和 花括号{ CMD1;CMD2;…; } 都可以将多个命令组合在一起,批量执行(list) list is executed in a subshell environment (see COMMAND EXECUTION ENVIRONMENT below). Variable assignments and builtin commands that affect the shell's environment原创 2021-08-03 10:04:23 · 1066 阅读 · 0 评论 -
Linux删除软链接不要使用rm -f
起因清理/root家目录,之前为了方便,对网卡目录做了软链接在家目录中。经过使用rm删除软链接时发生了小小的意外[08:29:51 root@C8-88[ ~]#lltotal 15892-rw-------. 1 root root 2590 Apr 28 10:08 88key-rw-r--r--. 1 root root 564 Apr 28 10:08 88key.pub-rw-------. 1 root root 1184 Mar 16 2020 an原创 2021-08-03 08:50:06 · 2227 阅读 · 0 评论 -
Ubuntu网卡配置文件配置网关之迷思gateway4
问题:配置Ubuntu网卡配置文件/etc/netplan/01-netcfg.yaml时,发现网关关键字必须设置为gateway4,尝试配置成其他数字后均报错,不设也报错。疑问:为何Ubuntu的网卡配置文件必须要设置成gateway4呢?解决:gateway4配置的时IPv4网络的网关地址。因为通常服务器都仅设置ipv4地址,并没有ipv6地址,所以忽略了gateway4是区分ipv6网关的关键字设置。一叶障目了!...原创 2021-07-13 20:37:02 · 6061 阅读 · 0 评论