三节点RAC反复重启的问题

bestsun999

已于 2024-09-18 16:26:10 修改

阅读量319

点赞数

CC 4.0 BY-SA版权

分类专栏： OracleDB 文章标签：运维 oracle linux

于 2023-04-16 08:58:53 首次发布

本文链接：https://blog.csdn.net/kevinyu998/article/details/130178843

OracleDB 专栏收录该内容

106 篇文章

订阅专栏

文章描述了一位技术专家遇到的三节点RAC数据库环境中，节点因心跳异常频繁重启的问题。通过检查netstat-s发现packetreassemblesfailed指标增加，然后调整了系统配置文件/etc/sysctl.conf中的IP碎片相关参数，成功解决了过去一个多月的重启问题。这种方法对于处理RAC环境中的网络性能和稳定性问题具有参考价值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有个客户数据库环境是三节点RAC，三个节点每周都有不定期轮流重启，每次看alert日志都是心跳异常被踢出集群。主机重启后又可以加入集群，百度了很多，最后参考了一个，已过去1个多月了，再也没有出现过重启的问题。记录下

检查netstat -s发现packet reassembles failed指标大量增加

netstat -s|grep "packet reassembles failed"
netstat -s | fgrep reassembles

配置/etc/sysctl.conf并生效

# echo 'net.ipv4.ipfrag_high_thresh = 16777216 ' >> /etc/sysctl.conf
# echo 'net.ipv4.ipfrag_low_thresh = 15728640 ' >> /etc/sysctl.conf
# echo 'net.ipv4.ipfrag_time = 120 ' >> /etc/sysctl.conf
# echo 'net.ipv4.ipfrag_secret_interval = 600 ' >> /etc/sysctl.conf
# echo 'net.ipv4.ipfrag_max_dist = 1024 ' >> /etc/sysctl.conf
# sysctl -p

RHEL 6.6: IPC Send timeout/node eviction etc with high packet reassembles failure (Doc ID 2008933.1)
Troubleshooting gc block lost and Poor Network Performance in a RAC Environment (Doc ID 563566.1)

Recommendation for the Real Application Cluster Interconnect and Jumbo Frames (Doc ID 341788.1)

Unable To Start ASM RAC Instances Due To ORA-27303: Remote Port MTU Does Not Match Local MTU. (Doc ID 947223.1)

Tuning Inter-Instance Performance in RAC and OPS (Doc ID 181489.1)

集群中所有节点配置私网的网卡有相同的mtu大小

#分片占用内存的高阈值
net.ipv4.ipfrag_high_thresh = 41943040
#分片占用内存的低阈值
net.ipv4.ipfrag_low_thresh = 40894464