【王树森推荐系统】推荐系统涨指标的方法03：排序模型

最新推荐文章于 2025-07-29 17:33:39 发布

好心的小明

最新推荐文章于 2025-07-29 17:33:39 发布

阅读量1.1k

点赞数 34

CC 4.0 BY-SA版权

文章标签：推荐系统推荐算法人工智能机器学习

精排模型的改进

基座的输入包括离散特征和连续特征，输出一个向量，作为多目标预估的输入
改进 1：基座加宽加深，计算量更大，预测更准确。embedding 的参数量特别大，但是全连接层的参数又不够大，所以加宽加深可以让预测更准。由于计算量也加大，所以就有一个投入产出比的问题。如果算力比较强而且工程架构比较先进，那么基座可以大一些，比如 6 个全连接层，否则基座会很小，只有一两层
改进 2：做自动的特征交叉，比如 bilinear 和 LHUC
改进 3：特征工程，比如添加统计特征，多模态内容特征

在这里插入图片描述

基于基座输出的向量，同时预估点击率等多个目标
改进 1：增加新的预估目标，并把预估结果加入融合公式
- 最标准的目标包括点击率，点赞率，收藏率，转发率，评论率等
- 寻找更多目标，比如加入评论区，给他人写的评论点赞等
- 把新的预估目标加入融合公式
改进 2：MMoE，PLE 等结构可能有效，但往往无效
改进 3：纠正 position bias 可能有效，也可能无效

物品ID 为用户最近交互过的物品 ID
最简单的方法是对物品向量取平均，作为一种用户特征
DIN 使用注意力机制，对物品向量做加权平均
工业界目前沿着 SIM 的方向做发展，先用类目等属性筛选物品，然后用 DIN 对物品向量做加权平均
改进 1：增加序列长度，让预测更准确。但是会增加计算成本和推理时间。主要看工程架构最多能抗多少的序列长度
改进 2：筛选的方法，比如用类目，物品向量表征聚类
- 离线用多模态神经网络提取物品内容特征，将物品表征为向量
- 离线将物品向量聚为 1000 类，每个物品有一个聚类序号，通常用层次聚类
- 线上排序时，用户行为序列中有 $n = 1, 000, 000$ 个物品。某候选物品的聚类序号是 70，对 $n$ 个物品做筛选，只保留聚类序号为 70 的物品。 $n$ 个物品只有数千个会被保留下来
- 同时有好几种筛选方法，取筛选结果的并集
改进 3：对用户行为序列中的物品，使用 ID 以外的一些特征
概括：沿着 SIM 的方向发展，让院士的序列尽量长，然后做筛选降低序列长度，最后将筛选结果输入 DIN

在这里插入图片描述

在这里插入图片描述

推全模型可能与 holdout 相同，也可能不同
图中有 4 套精排模型，那么就需要 4 套在线学习的资源。也就是说如果公司给了 4 套在线学习的资源，那么就只能测试两套新模型。想看 7 日留存模型就必须在线上跑 7 天，想看 30 日留存就必须跑 30 天。召回和重排越是同理，每个模型都需要一套在线资源，不过召回和粗排模型小，消耗的资源没那么多
线上有 $m$ 个模型，其中 1 个是 holdout，1 个是推全的模型，m - 2 个测试的新模型
每套在线学习的机器成本都很大，因此 m 数量很小，制约模型开发迭代的效率
在线学习对指标的提升巨大，但是会制约模型开发迭代的效率

已经得出初步结论，认为新模型很可能优于老模型。用几十天的数据训练新模型，早日追平老模型
方法 1：尽可能多地付用老模型训练好的 embedding 层，避免随机初始化 embedding 层（embedding 层是对用户，物品特点的记忆，比全连接层学得慢）
方法 2：用老模型做 teacher，蒸馏新模型（用户真实行为是 $y$ ，老模型预测是 $p$ ，用 $\over 2$ 作为训练新模型的目标）

在这里插入图片描述