- 博客(54)
- 收藏
- 关注
原创 贪心算法-不能导致全局最优的思考
路径规划中的贪心算法 设定走完一步 必须走后一步 后一步距离设置特别大,那么当时的贪心算法就就完全暴露他的缺点。就导致贪小便宜吃大亏的情况出现。2、比如系统是动态的系统,如果系统新加入的元素是变动,比如一个任务优先级高,但是执行时间长,新的任务优先级别低,但是时间短,不处理也会导致系统出问题。4、预则立,不预则费。不要执着,全盘考虑,动态规划,虽不至于最优,但也应不算太坏。1、局部最优不能导致全局最优,比如旅行路程,背包装东西问题。3、比如 多目标问题, 城市规划中的及交通,环境,经济问题。
2025-08-14 09:26:58
17
原创 Zabbix 监控代理采集监控指标超时问题
日常 Zabbix 监控运维巡检中,部分监控指标采集的监控值不连续、出现断点,甚至个别指标无法采集到对应监控值。
2025-07-26 14:46:51
155
原创 物理机的一些故障
LUN(逻辑单元):是存储阵列(如 SAN 存储)向主机提供的 “逻辑存储单元”,本质是从物理磁盘(或 RAID 组)划分出的一块逻辑存储空间,主机识别为 “虚拟磁盘”(如 Linux 中的/dev/sdb、Windows 中的 “磁盘 1”)。LUN ID:是存储阵列给每个 LUN 分配的唯一数字标识(通常是整数,如 0、1、2...),用于在存储系统内部区分不同 LUN,同时也是主机识别共享 LUN 的关键依据之一。解除卷组锁定状态,允许继续对卷组进行操作(如扩展、收缩逻辑卷)。
2025-07-25 21:05:30
288
原创 linux RHCS 资源冻结与恢复
这个操作会暂停集群对资源的自动监控和管理,但不会停止资源本身的运行。这个命令会让pacemaker重新纳管这个资源,集群会先停止这个资源,然后再启动。所以这个命令需要在变更窗口内做。暂停节点活动:将节点标记为 “待命” 后,集群会自动将该节点上的资源(如 VIP、应用服务)迁移到其他可用节点。维护模式:常用于计划内维护(如系统升级、硬件检查),避免直接停止节点导致服务中断。手动干预:允许管理员临时接管资源的控制(如手动调整配置、执行特殊操作)。暂停自动管理:集群不再自动监控资源状态、重启故障或迁移资源。
2025-07-20 09:37:12
273
原创 主机无法通过sftp远程登录
2、在/etc/ssh/sshd_config 中注释原配置#Subsystem stfp *,修改为Subsystem stfp internal-sftp.SFTP 服务将使用 OpenSSH 内置的 sftp-server,而非独立的外部程序。限制登录:当用户的 shell 被设置为 /sbin/nologin 时,该用户无法通过 SSH、终端或其他方式交互式登录系统。服务账户专用:该用户账户仍可被系统进程或服务使用(例如运行网站、数据库或定时任务),但无法执行交互式命令。再次验证sftp登录正常。
2025-07-20 09:13:55
155
原创 记录一次系统崩溃排查过程
软件模块的 closeHook 函数在处理文件关闭等逻辑时,涉及对 f->f_op 指针的访问(比如尝试调用 f_op 里的某个函数,如 open 相关逻辑,因偏移 0x60 通常对应 file_operations 里的 open 函数指针偏移 )。f_op = 0x0 表明 file 结构体(对应代码里的变量 f )的 f_op 指针为空(NULL ),f_op 是指向 file_operations 结构体的指针,用于存储文件操作函数表(如 open、read、write 等函数指针 )。
2025-07-13 11:06:36
342
原创 shell脚本-自动更新应用模块
更新 Linux 系统上的内核模块。脚本会将自身携带的压缩包部分解压到临时目录,然后比较新旧模块的 MD5 值,根据比较结果决定是否更新模块,最后清理临时文件。是一个自解压脚本的核心机制,它的作用是从当前脚本文件中提取出嵌入的压缩包内容并保存到临时文件中。条件表达式)的文件测试操作符,用于检查文件是否存在。(而非目录、设备文件等)。
2025-07-09 11:27:53
166
原创 mysql启动报错
本质原因:Linux 系统为安全考虑,会忽略全局可写的配置文件(防止恶意篡改),调整为合理权限(如。配置文件权限过 “开放”(全局可写),忽略该文件,导致启动异常。
2025-07-08 17:54:21
151
原创 mysql 备份时间优化
指定用于从数据库文件读取数据的线程数量,多线程读取可加快数据获取。:设置处理读取到数据(如解压缩、校验等)的线程数,让数据处理更高效。:定义将处理后数据写入备份文件的线程数量,加速数据写入备份存储。可以添加如下参数缩短备份时间,经过测试备份时间竟然节省一半。大数据量的 mysql 物理备份时间太长,添加参数进行优化。
2025-07-07 17:16:04
128
原创 hp开关机
如果是有NAS文件系统,操作系统重启后是不会自动挂载的,需要在操作系统启动后用root用户手工运行 mount –a 命令重新挂载。运行 cmviewcl –v,重点查看下图高亮中的SWITCHING选项是否都是enabled状态,如果有非enabled状态,先排除问题。一个目录下使用率(df -h)持续增高,但是通过du 命令逐级查看加起来 不够使用的,怀疑是有僵尸进程占用文件,如果操作系统是VCS双机,运行 /opt/VRTS/bin/hastatus -sum。root用户运行下面两个命令。
2025-07-06 20:09:33
291
原创 记一次同网段之间不能互访故障
6、查看网卡路由 发现管理ip 路由 添加到其它2台的访问 和默认路由冲突 在3台机器上删除除去自身的其它2台机器路由 即可。2、发现相邻ip 的同网段的服务器不能通 用ssh root@xxxx。4、sshd_config 文件 也正确。telnet xxx 22 端口也不通。1、3台机器需要配置免密登录。3、同机另一个网卡可通同网段。5、另一个网卡同网段能通。3、排除 免密输入错误。
2025-06-23 19:05:44
133
原创 查询消耗 IO 多的 SQL -达梦
视图统计正在执行的sql ,v$sql_stat_history历史视图统计。1、查询 I/O 繁忙的 SQL 语句。3、查询消耗临时表空间的sql 语句。2、查询归档最多的sql 语句。(IO 等待时间)降序排列。视图中选取会话 ID()、回收逻辑读计数()、IO 等待时间()、回滚页更改计数(
2025-06-22 20:52:34
202
1
原创 mq基础参数配置
集群队列是集群一部分的队列管理器可以将集群传输队列上的消息发送到在同一集群中的任何其他队列管理器。负责维护它所拥有的队列,并负责将它接收到的所有消息存储到适当的队列中。别名队列允许应用程序通过MQI调用中间件引用队列来访问队列。消息是对使用它的应用程序有意义的以字节为单位的字符串。本地队列标识属于应用程序连接的队列管理器的本地队列。传输队列是临时存储目标为远程队列管理器的消息队列。死信队列的本地名称,用存放无法正确路由的消息。远程队列标识属于另一个队列管理器的队列。队列是用于存储消息的数据结构。
2025-06-22 09:57:47
262
原创 linux路由
cat /etc/NetworkManager/system-connections/<连接名>.nmconnection。临时路由与0段路由(默认路由)的区别:临时路由和永久路由都会显示在当前路由表中,但临时路由在系统重启后会丢失。cat /etc/sysconfig/network-scripts/route-<接口名>x1目标 IP 地址(或网段),表示 “要访问的目的地”。的缩写,指定下一跳网关(路由器)的 IP 地址。中的路由未在上述输出中出现,则可能是临时路由。(表示 IP 范围从。
2025-06-19 21:45:27
409
原创 网卡故障排查-nic link is down
4、如果是绑定网卡检查/etc/sysconfig/network-scripts/ 和 /proc/net/bonding/目录下配置文件,cat /proc/net/bonding/bond0,确认网卡绑定信息。BONDING_OPTS="mode=1 miimon=100" # 绑定模式和监控参数。fault-tolerance (active-backup)(主备模式,mode=1)mode=1:主备模式(active-backup),仅一个接口工作,其他作为备份。
2025-06-18 21:55:26
1015
原创 nginx安装配置规范
Nginx的进程是使用经典的「Master-Worker」模型,master进程主要用来管理worker进程,包含:接收来自外界的信号,向各worker进程发送信号,监控worker进程的运行状态,当worker进程退出后(异常情况下),会自动重新启动新的worker进程;我们通常所说的代理,一般都指的是「正向代理」,是相对于客户端来说的,比方说我链接了一个VPN,我访问Google的时候,客户端发起的请求到了VPN,VPN帮忙转发请求Google的服务器,然后把Google响应返回给客户端。
2025-06-16 22:00:27
544
原创 虚拟机节点麒麟系统出现持续 CPU 软锁死(Soft Lockup),导致系统自动重启
3,在23.42版本之上的内核中,开启了napi_tx,tpacket_snd函数发送数据包,只能在软中断中执行tpacket_destruct_skb对pending_refcnt减1,在这之前CPU会陷入do-whlie循环中,而循环退出的条件又只能在软中断处理中去执行,刚好软中断也是在同一个CPU上,而且对应的ksoftirqd进程又被调度唤醒(实际得不到执行),在硬中断irq_exit中也无法执行软中断处理,即此CPU上的软中断永远得不到调度执行了,从而就卡死在这里了。
2025-06-15 09:56:40
998
原创 软死锁的检测--看门狗
比如某 CPU 上有个无限循环的内核任务(如驱动 bug 导致死循环 ),会持续霸占 CPU,使看门狗线程无法获得调度权 → 时间戳无法更新 → 定时器检查超时 → 触发软死锁告警。总结来说,软死锁看门狗是通过定时检查 CPU 调度心跳(时间戳) 的机制,发现并告警 “任务长期阻塞 CPU 导致无法调度” 的问题,本质是用 “周期性验证” 确保系统调度的活性。简单说:若 “定时检查” 发现 “喂狗” 超时,说明 CPU 调度被长时间阻塞,触发软死锁告警。
2025-06-14 22:17:43
480
原创 mysql 创建大写字母的表名失败
Linux 环境下 Mysql 数据库名与表名是严格区分大小写的(系统库 information_schema 及其之下的表除外 ),该限制取决于 mysql 配置文件参数 lower_case_table_names,而默认该参数是未配置的。编辑 mysql 的配置文件 /etc/my.cnf 配置文件,在 [mysqld] 下面添加一行配置,lower_case_table_names=0,并重启 mysql 服务即可。
2025-06-14 21:08:54
346
原创 重启杀手--误操作梳理
3、虚拟创建时虚拟磁盘sdx被做了两次pvcreate,造成同一块盘生成了两个标签 无法正常重启。6、windows补丁升级策略设置4,并设置每周x晚上x点安装补丁并重启。2、不经过测试删除某些低版本的正在用的mysql 安装包,导致 mysql数据库运行异常。5、 补丁审批策略调整为+3日后审批,理解为3日后审批通过,补丁才可下发至各操作系统。7、vc部署虚拟机错误 误删除了 与原来主机名重复的虚拟机。结果微软解释,各操作系统理解为补丁下发3日后自动更新重启。微软每月10日发布最新补丁。
2025-06-12 22:49:06
280
原创 windows基线配置
打开CMD命令行窗口输入“gpedit.msc”回车,在打开的“组策略”对话框中选择“计算机配置”-> “windows设置”->“安全设置”->“账号策略”->“密码策略”中“密码必须符合复杂性要求”选择“已启动”、“密码长度最小值” 设置为“8个字符”。依次选择:“开始”-> “控制面板”->“管理工具”->“本地安全策略”->“本地策略”->“审核策略”,在“审核登录事件”选项上双击鼠标左键,在弹出的对话框中勾选“成功”“失败”两项,然后点击下方“确定”按钮完成设置。
2025-06-11 21:39:31
586
原创 oracle 安全基线配置
应更改数据库账号的默认口令,避免使用默认口令的账号登陆到数据库(Oracle数据库中的默认账号/默认密码如下:sys/change_on_install、system/manager、sysman/oem_temp、scott/tiger、aqadm/aqadm、dbsnmp/dbsnmp)数据字典中可能包含数据库设计资料、储存的SQL程序、账号权限、账号统计、数据库进程信息、数据库的增长统计、数据库性能统计等重要信息,未对数据字典进行安全防护会导致信息泄露风险提升。
2025-06-10 20:46:06
880
原创 shell脚本--查看应用的cpu 和 内存使用率 并把最新告警内容显示出来
| awk '{print $9}':提取每行第 9 列(top 中第 9 列默认是 CPU 使用率)。awk NR==1'{print $1}':在 CPU 使用率结果里,取第 1 行数据,赋值给。提取该行第 4 列内容(一般是进程 PID),最终把 PID 赋值给变量。(理论上多次采集结果一致,取首行简化)。#把告警日志最后100行追加到固定文件中。#重定向cpu 使用率到固定文件中。#追加内存使用到文件中。#查看是否有告警日志。
2025-06-10 20:45:43
182
原创 linux 下常用变更-8
echo /usr/sbin/tmpwatch -umc 48 /var/cache/logwatch >> /etc/cron.daily/tmpwatch ##新增清理48小时以上日志指令到计划任务中。sed -i '/\/usr\/sbin\/tmpwatch\ -umc*/d' /etc/cron.daily/tmpwatch ##删除现有cron中包含的删除指令。mkswap /dev/vg_00/lvswap 格式化lvswap卷为swap分区格式。
2025-06-09 20:10:51
709
原创 ASM,LVM,扫描并扩容步骤-linux
备份文件 cp /etc/udev/rules.d/99-oracle-*.rules /etc/udev/rules.d/bak99-oracle-*.rules。指定触发事件的对象类型为 设备节点(即 /sys 目录下的设备)。参数选项,指示 udev 重新加载 /etc/udev/rules.d/ 和 /lib/udev/rules.d/ 目录下的所有规则文件。在 /dev 目录下创建符号链接(如 /dev/asm-data1),指向实际设备(如 /dev/sddl1)。
2025-06-08 11:19:59
717
原创 Linux操作系统故障应急场景及对应排查方法
如果主机无法正常启动,则根据主机启动报错信息进行修复。现场保护:这种情况下,通常日志系统(syslog)已经不再记录信息,只能对主机执行重启操作;使用root用户登录主机,执行sosreport -a命令保存现场信息收集系统日志,查看/var/crash/是否有vmcore日志。使用root用户登录主机,执行sosreport -a命令保存现场信息收集系统日志,查看/var/crash/是否有vmcore日志。通过堡垒机使用root用户登录主机,执行sosreport命令保存现场信息。
2025-06-07 18:16:59
568
原创 linux 故障处置通用流程-36计-28-37
系统显示硬盘上的系统已经被找到,并挂载在/mnt/sysimage目录下;2、在生产环境应慎用此命令:虽然清理缓存时影响应用程序上下文的可能性很小,但是最好在关闭应用程序后再行清理。在/proc/net/bonding/bond?”表示bonding网卡的序号,通常为bond0、bond1等。选择是否让系统查找硬盘上的Linux系统,选择“Continue”;1、在清理内存之前,先执行 "sync" 命令刷新系统buffer;使用修改好的菜单引导系统,按“b”键,以单用户模式临时引导系统;
2025-06-06 23:07:01
1093
原创 linux 故障处置通用流程-36计-14-27
使用ethtool命令,查看网卡配置是否正常,主要关注网卡连接模式(10/100/1000baseT)及工作模式(Half/Full)。配置文件:检查/etc/passwd,/etc/hosts,/etc/services等配置文件是否正常;#tail -2000 /var/log/messages 查看日志信息。查看日志:tail -f /var/log/messages;查看日志:tail -f /var/log/messages。查看日志:tail -f /var/log/messages。
2025-06-05 22:51:49
1324
原创 linux 故障处置通用流程-36计+1计
登录VM Vcenter-通过搜索查询到所需操作的虚拟机-右键虚拟机-启动-重新启动客户机操作系统。登录VM Vcenter-通过搜索查询到所需操作的虚拟机-右键虚拟机-启动-关闭电源。登录华为云 ManagerOne-左侧服务列表-弹性云服务器-更多-实例状态-关机。登录华为云 ManagerOne-左侧服务列表-弹性云服务器-更多-实例状态-重启。top--在程序界面中,查看MEM、Swap、Buffer、Cache数值;执行 sar -u -f /var/log/sa/sa+日期。
2025-06-04 23:41:41
536
原创 redhat变更旧nas挂在参数不生效
小结:在RedHat7中,针对已存在NAS卷的挂载,若计划采用新的挂载参数,建议采用先卸载卷,然后再挂载卷的方式,可以有效规避挂载参数不生效的问题。15 0 华青山[C0240145] 2024-06-20 15:45:08 所属分类:知识分享-操作系统。//参数设置:NAS卷在操作系统中远程挂载参数的变化(""文中星号符,在不影响阅读情况下,用于数据脱敏使用)//先卸后挂:经测试,采用先卸载,后重新挂载的方式,即可高效。//重新挂载:采用自动挂载方式,发现配置参数未生效。
2025-06-03 21:32:19
234
原创 windows 系统powershell 执行策略
Windows 系统 PowerShell 的执行策略是一种安全功能,用于控制 PowerShell 加载配置文件和运行脚本的条件,帮助防止恶意脚本的执行。
2025-06-02 21:58:40
290
原创 麒麟系统反复重启无法进入系统 故障(缺少内核文件 fstab文件写错)
6、备份/boot目录,重新生成内核文件initramfs-4.19.90-23.40.02101.ky10 .aarch64.img,并注释/tmp目录后再次重启服务器,发现操作系统启动成功。定位到问题根因,/etc/fstab配置文件中/tmp挂载路径不对,导致系统无法对tmp目录进行挂载,注释掉tmp挂载点之后,系统可以正常启动。进入救援模式,挂载/、/boot和/boot/efi目录,进入/boot目录查看是否丢失文件,查询后未发现有文件丢失。/home/ap/nas挂载失败。
2025-05-31 17:00:19
387
原创 /var 满导致应用用户无法登录故障排查
PAM 模块故障:用户认证依赖 PAM(Pluggable Authentication Modules),若。,磁盘满会导致数据库服务崩溃,进而影响依赖数据库的登录系统(如 Web 应用的用户认证)。数据库无法写入:若应用依赖的数据库(如 MySQL)数据目录在。满,PAM 可能因无法写入日志或临时文件而拒绝认证。生成临时密钥或会话文件,磁盘满会导致创建失败。),若磁盘满则无法写入,可能导致登录流程中断。,磁盘满可能导致服务无法正常运行。)无法更新,导致登录状态丢失。临时文件,导致切换用户失败。
2025-05-31 16:34:18
185
原创 logrotate 切割日志 copytruncate 和 sendsignal
复制并截断:先复制当前日志文件内容到新文件(如 access.log.1),然后截断原日志文件(清空但保留文件 inode),让应用程序继续向原文件路径写入新日志。数据丢失风险:复制和截断操作之间的日志可能丢失(尽管时间极短)。应用程序响应:应用程序收到信号后,关闭旧日志文件句柄,重新打开新创建的。高可用性场景:严格要求无数据丢失(如金融、医疗日志)。的内容(文件大小变为 0),但保留文件路径和权限。发送信号:切割日志后,向应用程序发送特定信号(如。),通知其重新打开日志文件,避免数据丢失。
2025-05-30 08:59:28
230
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人