电商知识图谱链接预测:XTransE模型解析与应用
立即解锁
发布时间: 2025-08-17 01:29:15 阅读量: 1 订阅数: 3 

### 电商知识图谱链接预测:XTransE模型解析与应用
在当今电商领域,如何提升商品展示的多样性,满足用户多样化的购物需求,是一个关键问题。本文将围绕电商中生活方式交易的核心任务——建立商品与生活方式之间的关联,介绍一种可解释的知识图谱嵌入方法XTransE,以及相关的实验结果和分析。
#### 1. 电商背景与问题提出
- **电商现状**:像亚马逊和阿里巴巴这样的电商平台,每天有大量用户进行交易,商品数量众多。但目前平台大多根据用户搜索查询返回精确匹配的商品,缺乏多样性。
- **生活方式交易的引入**:为解决商品展示单一的问题,引入了基于生活方式的交易概念。生活方式反映了用户的活动、兴趣和观点,通过挖掘商品与生活方式的关系,可以为用户展示更多相关商品。例如,当用户搜索“花盆”时,不仅返回花盆,还会展示与“花卉栽培”生活方式相关的盆景、花卉书籍和花瓶等。
- **知识图谱与链接预测**:将商品与生活方式的关联问题转化为知识图谱链接预测任务。知识图谱以三元组(头实体,关系,尾实体)的形式存储事实,链接预测旨在学习实体之间的潜在关系。
#### 2. 方法介绍
##### 2.1 问题定义
将商品 - 生活方式链接预测问题定义为知识图谱链接预测(KGLP)任务。构建商品 - 生活方式知识图谱,其中三元组表示商品的属性,“belongTo”关系表示商品与生活方式的关联。任务是在给定商品实体和“belongTo”关系的情况下,预测对应的生活方式实体。
##### 2.2 解决方案
- **知识图谱嵌入模型 - XTransE**
- **基于TransE的改进**:TransE是一种简单有效的知识图谱嵌入方法,将实体和关系嵌入为向量,认为关系是从头实体到尾实体的平移。在此基础上,提出了具有注意力机制的XTransE方法。
- **输入与得分函数**:XTransE的输入是商品 - 生活方式三元组,得分函数定义为 \(f(e_I, r_b, e_L) = \|e_I + r_b - e_L\|_2^2\),其中 \(e_I\)、\(r_b\) 和 \(e_L\) 分别是商品、“belongTo”关系和生活方式的嵌入,\(\|·\|_2^2\) 是欧几里得距离。
- **注意力机制**:为了生成解释,引入了对商品的注意力机制。生活方式对商品不同属性 - 值对的注意力有助于理解它们之间的相关性。商品的嵌入 \(e_I\) 是其特定三元组嵌入的加权和,特定三元组嵌入通过 \(e_{I(r,e)} = e - r\) 计算,注意力值 \(a_{e_L(r,e)}\) 通过 \(a_{e_I(r,e)} = \frac{e^{e_{I(r_b,e_L)}e_{I(r,e)}}}{\sum_{(e_I,r_j,e_j)\in K, r_j\in P} e^{e_{I(r_b,e_L)}e_{I(r_j,e_j)}}}\) 计算。
- **损失函数**:采用最大间隔损失函数 \(L = \sum_{(e_I,r_b,e_L)\in K} \max(0, \gamma + f(e_I, r_b, e_L) - f(e_I, r_b, e'_L))\) 进行训练,其中 \((e_I, r_b, e'_L)\) 是通过随机替换 \(e_L\) 得到的负三元组。
- **解释生成器**:XTransE中的注意力值揭示了不同属性 - 值对与当前商品 - 生活方式预测的相关性。解释生成器对所有注意力值进行排序,选择前 \(k\) 个注意力值对应的属性 - 值三元组作为解释。
- **规则收集器**:规则由头和体组成,如 \(head \leftarrow body\)。在本文中,学习以 \((e_I, r_b, e_L)\) 为头,包含属性 - 值原子的规则。根据解释生成器生成的 \(k\) 个解释,通过不同的组合生成多个规则。
#### 3. 实验与结果
##### 3.1 数据集
实验使用的商品 - 生活方式知识图谱数据集包含72849个实体、758个属性关系、一个“belongTo”关系和1875438个三元组。将商品 - 生活方式三元组按80%和20%的比例划分为训练集和测试集。
##### 3.2 预测实验
- **评估指标**:采用准确率(Accuracy)和平均排名(Mean Rank,MR)作为评估指标。准确率是排名为1的测试三元组
0
0
复制全文
相关推荐










