推荐系统的两大创新技术:协同因子与个性化标签推荐
立即解锁
发布时间: 2025-08-22 01:46:14 阅读量: 1 订阅数: 17 


网络时代的个性化标签推荐系统
### 推荐系统的两大创新技术:协同因子与个性化标签推荐
#### 协同矩阵分解提升推荐准确性
在信息爆炸的时代,推荐系统成为了处理信息过载问题的关键工具。推荐系统基于用户偏好为用户推荐物品,用户对物品的偏好通过显式评分或隐式反馈体现,这些信息存储在稀疏的评分矩阵中。
现有的推荐算法主要分为基于内容的过滤和协同过滤(CF)。基于内容的过滤需要收集可能难以获取的内容信息,而协同过滤仅依赖用户的历史记录。协同过滤又可分为基于最近邻的方法和潜在因子模型,后者因Netflix竞赛的成功而备受关注,出现了许多改进预测准确性的变体。
为了充分利用这两种策略,研究人员尝试将不同的协同过滤方法结合起来,现有研究主要分为以下几类:
1. 将邻居的偏好融入潜在因子方法。
2. 对邻域进行分解以直接建模邻居关系。
3. 利用外部数据更真实、精确地建模关系。
然而,在现实世界中,用户和物品并非相互独立,而以往的研究并未直接将相似实体的潜在因子纳入潜在因子模型。为了提高推荐准确性,研究引入了协同因子,通过邻居的因子进行平滑处理,以更好地捕捉用户和物品的内在特征,并提出了协同矩阵分解(CoMF)模型。
##### 协同因子的定义
给定一个活跃用户和一个目标物品,用户邻居的因子称为协同用户因子,物品邻居的因子称为协同物品因子,两者统称为协同因子。其计算公式如下:
- 协同用户因子:
\[
p_{uc} = (1 - \alpha)p_u + \alpha\sum_{v \in N(u)} s_{uv}p_v
\]
- 协同物品因子:
\[
q_{ic} = (1 - \beta)q_i + \beta\sum_{j \in N(i)} s_{ij}q_j
\]
其中,\(p_{uc}\) 表示用户 \(u\) 经邻居平滑后的因子,\(q_{ic}\) 表示物品 \(i\) 经邻居平滑后的因子,\(s_{uv}\) 是用户 \(u\) 和 \(v\) 的相似度,\(s_{ij}\) 是物品 \(i\) 和 \(j\) 的相似度,\(\alpha\) 和 \(\beta\) 是确定个体因子和协同因子权重的常数。
##### 协同矩阵分解模型表示
用 \(b_{ui}\) 表示偏置项效应,它由全局效应、用户效应和物品效应组成。将传统潜在因子模型中的用户和物品因子替换为协同因子,得到协同矩阵分解模型的公式:
\[
\hat{r}_{ui} = b_{ui} + \left((1 - \alpha)p_u + \alpha\sum_{v \in N(u)} s_{uv}p_v\right)^T\left((1 - \beta)q_i + \beta\sum_{j \in N(i)} s_{ij}q_j\right)
\]
##### 学习算法
为了找到CoMF的最优解,对实际观测评分和预测值之间的平方误差之和进行最小化处理。目标函数定义为:
\[
L = \min \sum_{(u, i) \in S} (r_{ui} - \hat{r}_{ui})^2 + \lambda_1\left(\sum_{u} p_u^2 + \sum_{i} q_i^2\right) + \lambda_2\left(\sum_{u} b_u^2 + \sum_{i} b_i^2\right)
\]
其中,\(\hat{r}_{ui}\) 遵循上述公式。为了学习最优解(\(b^*\)、\(p^*\) 和 \(q^*\)),采用随机梯度下降算法,遍历所有已知评分。
##### 实验结果
研究在Movielens数据集和Epinions数据集上进行了实验,采用均方根误差(RMSE)进行5折交叉验证。将CoMF与以下几种方法进行比较:
| 方法 | 描述 |
| ---- | ---- |
| UserMean | 利用其他用户的平均值预测缺失值 |
| ItemMean | 应用每个物品的平均值预测缺失值 |
| Biased SVD | 正则化项设为0.05,学习率为0.005 |
| SVD++ | 正则化项为0.055,学习率为0.07 |
| RSTE | \(\alpha\) 设为0.6,正则化项为0.04,学习率为0.01 |
实验结果表明,CoMF在两个数据集上均显著优于其他方法,具体结果如下表所示:
| 数据集 | D | 指标 | UserMean | ItemMean | BSVD | SVD++ | RSTE | CoMF |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| Epinions | 5 | RMSE | 1.1988 | 1.0942 | 1.0380 | 1.0408 | 1.0480 | 1.0094 |
| | | 提升 | 15.80% | 7.75% | 2.76% | 3.02%
0
0
复制全文
相关推荐










