隐式反馈数据的协同过滤与知识图谱嵌入优化

### 隐式反馈数据的协同过滤与知识图谱嵌入优化在当今的信息时代，推荐系统和知识图谱技术在各个领域都发挥着至关重要的作用。推荐系统能够根据用户的历史行为和偏好，为用户提供个性化的推荐，而知识图谱则可以将各种实体和它们之间的关系进行结构化表示，帮助我们更好地理解和处理信息。本文将围绕隐式反馈数据的协同过滤方法以及知识图谱嵌入的优化展开讨论。 #### 隐式反馈数据的协同过滤在推荐系统中，隐式反馈数据是一种常见的数据类型，它不像显式反馈数据（如评分）那样直接表达用户的喜好，但同样包含了丰富的信息。为了处理隐式反馈数据，研究人员提出了一种名为 CoF（Conformative Filtering）的新方法。 ##### 不同推荐器的性能比较研究人员在两个真实世界的数据集（Ta - feng 和 Movielens20M）上对 CoF 与多种基线方法进行了广泛的实验比较。在召回率（recall@R）方面，Ocular 与 BPR 和 WRMF 表现相当，但 WRMF 和 BPRMF 在较大的截断值（cutoff values）下表现更好。有趣的是，GBPR 在 Ta - feng 数据集上的性能优于所有基线方法，但在 Movielens20M 数据集上，尽管进行了大量的参数调整，其表现仍不尽如人意。这可能是因为 GBPR 倾向于关注流行项目，而 Ta - feng 是一个杂货数据集，某些常见物品（如面包）几乎出现在每个客户的购物篮中，关注这些物品可能会导致较高的召回率；而电影领域则更加个性化，关注流行项目可能无法满足用户的不同口味。在 AUC（Area Under the Curve）指标方面，CoF 在两个数据集上都优于基线方法。这表明 CoF 能够识别出“真正的”负样本，并将它们排在排名列表中低于用户感兴趣物品的位置。BPRMF 在两个数据集上的 AUC 表现排名第二，这是因为 BPRMF 是针对 AUC 进行优化的。此外，虽然 WRMF 在 recall@R 方面表现优于 BPRMF，但在 AUC 方面的表现较低，这进一步证明了前 R 指标的得分与评估整个列表的指标可能不相关，因此应根据推荐目标选择合适的指标。在实验中，SLIM 在所有指标上的表现最低，值得注意的是，实验设置（按时间分割数据）和使用的指标与通常评估 SLIM 的实验条件不同。具体的 AUC 数据如下表所示： | 推荐器 | Ta - feng | ML - 20M | | ---- | ---- | ---- | | BPRMF | 0.74977 | 0.87289 | | WRMF | 0.71316 | 0.85258 | | CoF | 0.7793 | 0.88816 | | Ocular | 0.63653 | 0.84879 | | SLIM | 0.68321 | N.A | | GBPR | 0.71117 | 0.80367 | ##### CoF 参数的影响 CoF 首先运行 HLTA（Hierarchical Latent Tree Analysis）来学习一个层次模型，然后使用该模型进行物品推荐。它有两个参数：第一个参数 l 决定使用层次结构的哪一层，l 越大，用户口味组的数量就越少；第二个参数 H 决定在表征用户组时使用的消费历史量。虽然这两个参数都是通过验证来选择的，但了解它们如何影响 CoF 的性能是很有趣的。在 Ta - feng 数据集上，当 l = 1 时，recall@20 分数随 H 的变化曲线先上升后下降，在 H = 20 时达到最大值。这是因为当 H 太小时，用于表征用户口味组的数据包含的信息太少；而当 H 太大时，包含的历史信息过多，数据无法反映用户组的当前兴趣。AUC 分数随 H 的变化也呈现类似的趋势，但 H 对 AUC 的影响不如对 recall@20 的影响明显。此外，CoF 对参数 l 的选择或多或少是稳健的，无论选择哪一层，性能几乎相同，这有点出乎意料，因为随着 l 的增加，口味变得更加通用，人们原本预计性能会下降。下面是 CoF 参数影响的简单流程图： ```mermaid graph LR A[开始] --> B[设置 l = 1] B --> C[改变 H 值] C --> ```

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

隐式反馈数据的协同过滤与知识图谱嵌入优化

相关推荐

专栏目录

隐式反馈数据的协同过滤与知识图谱嵌入优化

相关推荐

基于Python的隐式数据集快速协同过滤算法设计源码

Python实现的知识图谱推荐算法MKR源码（附项目说明与数据集）

协同过滤与推荐系统进展

python版本基于ChatGLM的飞书机器人.zip

CSP竞赛动态规划与图论高效代码实现：Dijkstra算法及状态压缩DP的应用与优化

电气工程基于阻抗频谱的电缆缺陷检测与定位方法研究：电缆健康监测系统设计及实验验证（论文复现含详细代码及解释）

《Selenium3自动化测试实战--基于Python语言》书中代码.zip

ctkqiang_HuaTuoAI_27288_1755685691704.zip

基于Python 编写的高性能Ngrok客户端，有效解决内存泄漏.zip

基于 Python 的音乐服务.zip

【API接口工具】postman-变量定义、使用详解

WebSocket 实时通信在前端的应用实例.doc

专栏目录

最新推荐

探索数据库需求分析工具：【提高效率】的关键利器

FUNGuild与微生物群落功能研究：深入探索与应用

【进阶知识掌握】：MATLAB图像处理中的相位一致性技术精通

【FPGA信号完整性故障排除】：Zynq7045-2FFG900挑战与解决方案指南

【紧急行动】：Excel文件损坏，.dll与.zip的终极解决方案

【VB.NET GUI设计】：WinForms与WPF设计与实现的艺术

高斯过程可视化：直观理解模型预测与不确定性分析

【MATLAB词性标注统计分析】：数据探索与可视化秘籍