【Graph Embedding】LINE的原理、核心代码及其应用

最新推荐文章于 2024-08-21 10:50:16 发布

zhong_ddbb

最新推荐文章于 2024-08-21 10:50:16 发布

阅读量1.3k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：推荐系统深度学习 tensorflow2.0 文章标签：图嵌入深度学习推荐系统 LINE

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhong_ddbb/article/details/109110375

文章目录

LINE基本思想

LINE: Large-scale Information Network Embedding与DeepWalk相似都是基于领域相似假设的方法，DeepWalk是基于深度优先搜索，LINE是基于广度优先搜索。LINE还可以应用在带权图中(DeepWalk仅能用于无权图)。不同graph embedding方法之间的一个主要区别是图中顶点之间的相似度的定义不同，在LINE中有两种相似度的定义方法。

如下图：

在这里插入图片描述

图中的边可以是有向的也可以是无向的，或者是带权边。顶点6和顶点7之间的边权重较重，他们在低维空间内的表示向量应该是相似的。但当两个顶点之间不存在边时，如顶点5和顶点6，并不能说二者之间没有关系，因为顶点5和顶点6具有相同的邻接顶点（顶点1，2，3，4）。这就是LINE的两种相似度的基本思想。

LINE是基于顶点之间的相似度进行建模，第一步将顶点Embedding到指定维度，利用Embedding的表示向量计算顶点A与顶点B之间的相似度，让相似度去拟合顶点A，B 之间的边的权重，得到最优的顶点的嵌入向量。

一阶相似度

一阶相似度用于描述图中成对顶点之间的局部相似度,即只有当边与边之间存在连接时,顶点之间才有相似度,相似度与边之间的权重成正比,图中的顶点6,7 权重较大,相似度为1。顶点5和顶点6之间不存在边，相似度为0。

优化目标

假设用 $u_i,u_j$ 作为节点的低维向量表示，对于每一条无向边 $(i, j)$ ，顶点 $u_i,u_j$ 之间的联合概率密度为：
$p_1(v_i,v_j) = \frac{1}{1+exp(-u_i^T \cdot u_j)}$
若两个向量相似，则 $p(v_i,v_j)$ 也较大。

同时，两节点之间的经验概率如下：
$\hat p_1(i,j) = \frac{w_{ij}}{W} \\ W = \sum_{(i,j) \in E} w_{ij}$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。