踩坑记：go服务内存暴涨

原创

于 2020-04-26 12:05:00 发布 · 4k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#go #linux #内存管理 #内存泄漏

本文记录了一次由于Go服务升级到1.12版本导致的内存暴涨问题的调查过程。经过排查，发现Go 1.12在Linux上使用MADV_FREE释放内存，可能导致RSS增高，但在需要时内核会回收。通过模拟内存需求，证实了内存回收的策略。最后，文章提到这种内存管理策略在字节跳动的实际工作中确实存在，并分享了相关的面试知识点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这周换换口味，记录一下去年踩的一个大坑。

== 起 ==

大概是去年8月份，那会儿我们还在用着64GB的“小内存”机器。

由于升级一次版本需要较长的时间（1~2小时），因此我们每天只发一次车，由值班的同学负责，发布所有已merge的commit。

当天负责值班的我正开着车，突然收到 Bytedance-System 的夺命连环call，打开Lark一看：

[ 规则 ]：机器资源报警

[ 报警上下文 ]：

host: 10.x.x.x

内存使用率: 0.944

[ 报警方式 ]：电话&Lark

打开ganglia一看，更令人害怕：

== 承 ==

这看起来像是典型的内存泄漏case，那就按正常套路排查：

一方面，通知车上的同学review自己的commit，看看是否有代码疑似内存泄漏，或者新增大量内存占用的逻辑；

另一方面，我们的go服务都默认开启了pprof，于是找了一台机器恢复到原版本，用来对比内存占用情况：

$ go tool pprof http://$IP:$PORT/debug/pprof/heap 
(pprof) top 10
Showing top 10 nodes out of 125
      flat  flat%   sum%        cum   cum%
 2925.01MB 17.93% 17.93%  3262.03MB 19.99%  **[此处打码]**
 2384.37MB 14.61% 32.54%  4817.78MB 29.52%  **[此处打码]**
 2142.40MB 13.13% 45.67%  2142.40MB 13.13%  **[此处打码]**
 ...

就这样，一顿操作猛如虎，涨跌全靠特朗普，最终结果是，一方面没看出啥问题，另一方面也没看出啥问题。

正在一筹莫展、准备回滚之际，内存它自己稳了：

虽然占用率仍然很高，但是没有继续上升，也没有出现OOM的情况。

== 转 ==

排查过程中，我们还发现一个现象：并不是所有机器的内存都涨。

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄18年

34
原创

36
点赞

72
收藏

32
粉丝

关注

私信

热门文章

上一篇：: TCP：学得越多越不懂

下一篇：: [译] Ｃ程序员该知道的内存知识 (1)

最新评论

踩坑记：Go服务灵异panic
SnailMann: 可惜内网没搜到你文章，大流量场景复现了，瞅代码在string上还懵了半天
实战：150行Go实现高性能socks5代理
不太聪明的样子: 我用 c++ 实现了一个 socks5-server，有兴趣的小伙伴也可以看看 https://github.com/xukeawsl/socks-server
实战：150行Go实现高性能socks5代理
不太聪明的样子: 我测试的时候会报 unknow address 这个错，需要手动在 /etc/hosts 中添加 dns 映射才行
千万级广告定向
felix021: 标签枚举数量「多不多」取决于业务，确实会比较消耗内存，所以需要通过 RoaringBitmap 来压缩。穿山甲是有专门的服务来做这个检索，如果放到redis或者hbase的话，还需要额外的网络通信，肯定是更慢了；分段和并行自己做就行了，并行太多的话，调度的开销可能会得不偿失。
千万级广告定向
Chris徐: 大佬，我理解这种技术方案，支持的标签对应的枚举不能太多，当一个请求过来后，取出当前用户这几个标签的枚举对应的bitmap，例如用户的区域是北京则取出北京对应的bitmap；将这些bitmap做and操作，得到的结果就是根据这个人定向出的广告；这个应用应该比较消耗内存。而且这些bitmap应该放redis或hbase响应会快一些；也可以将bitmap 按照每200万一段，分段，这样不同标签的枚举在段上可以并行拉去，并行计算。而且分段在一定程度上可以支持更大的数据量。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。