1、平时负载情况是否正常。
如并发的各个节点的并发数是多少。
2、进程CPU使用率情况: atop
3、进程内存分布情况:
pmap
超过80% 的内存需要重点关注。
4、网络吞吐量情况:/proc/net/dev
5、TCP重传率是否正常:
监控服务器的TCP重传率是否过高。
6、各中心可用情况是否正常:
7、关联系统网络链接情况是否正常:
与核心系统及主要关联系统网络链接情况
8、系统文档存储空间剩余量:df -TH
9、进程IO大小及IO延迟情况是否正常:pidstat -d
10、磁盘空间、表空间的使用增长率是否正常
针对表空间使用率超过90%的表空间,检测主要使用的表。想办法降低表的数据插入,并根据业务情况,适当删除数据。