图卷积与基因组数据的图表示:方法与应用
立即解锁
发布时间: 2025-08-23 02:14:28 阅读量: 1 订阅数: 3 

# 图卷积与基因组数据的图表示:方法与应用
## 1. 图卷积网络(GCN)
图卷积网络(GCN)为图结构数据的半监督学习提供了一种有效方法,它基于能直接在图上操作的卷积神经网络的高效变体。对于半监督标签传播,两层GCN模型的形式如下:
\[E = f(X, A) = \text{softmax}(\hat{A}\text{ReLU}(\hat{A} \dot{X}W^{(0)})W^{(1)})\]
其中,\(\dot{X} \in R^{N×d}\) 表示具有 \(N\) 个样本和 \(d\) 个维度的输入数据,\(\hat{A}\) 是重新归一化的图矩阵,\(W^{(0)} \in R^{d×H}\) 是具有 \(H\) 个特征的隐藏层的输入到隐藏权重矩阵,\(\text{ReLU}()\) 是修正线性激活函数,\(W^{(1)} \in R^{H×M}\) 是具有 \(M\) 个特征图的隐藏到输出权重矩阵,\(M\) 表示类别数量,\(\text{softmax}\) 表示softmax激活函数,\(E \in R^{N×M}\) 是标签矩阵。
GCN通过谱图卷积的局部一阶近似来选择卷积架构,常用于图结构数据的半监督分类,如引文网络或知识图谱数据集。
## 2. 提出的方法
受GCN启发,我们联合使用数据及其关联图,以推导数据的非线性嵌入,而非仅像某些工作那样进行标签传播。基本思路是用数据样本与特定图的卷积替换原始样本。为此,我们使用谱图卷积的一阶近似来替换回归模型中的原始样本数据,目标是估计基于图卷积的最终非线性嵌入。
谱图卷积定义为信号 \(x \in R^{N}\) 与滤波器 \(g_w = \text{diag}(w)\) 的乘法,其中 \(w \in R^{N}\) 在傅里叶域参数化:
\[g_w \star x = U \cdot g_w \cdot U^T \cdot x\]
此式的计算复杂度为 \(O(N^2)\)。为解决计算成本高的问题,有人提出用Chebyshev多项式展开 \(g_w\):
\[g_{w'} \approx \sum_{k=0}^{K} w_k' \cdot T_k(\tilde{\Lambda})\]
其中 \(T_k\) 是Chebyshev多项式,\(T_k(x) = 2xT_{k - 1}(x) - T_{k - 2}(x)\),\(T_0(x) = 1\),\(T_1(x) = x\),拉普拉斯矩阵 \(L\) 的最大特征值记为 \(\lambda_{max}\),\(\tilde{\Lambda} = \frac{2}{\lambda_{max}} \Lambda - I\),\(w_k'\) 是Chebyshev系数。则用Chebyshev多项式截断展开的谱图卷积可重写为:
\[g_{w'} \star x \approx \sum_{k=0}^{K} w_k' \cdot T_k(\tilde{L}) \cdot x\]
其中 \(\tilde{L} = \frac{2}{\lambda_{max}} L - I\)。若仅展开一阶多项式并进一步近似(\(k = 1\) 且 \(\lambda_{max} \approx 2\)),可得:
\[g_{w'} \star x \approx w_0'x + w_1'(\frac{2}{\lambda_{max}} L - I)x = w_0'x - w_1'D^{-\frac{1}{2}}SD^{-\frac{1}{2}}x \Rightarrow w(I + D^{-\frac{1}{2}}SD^{-\frac{1}{2}})x\]
为解决过拟合问题并减少矩阵乘法次数,可令 \(w = w_0' = -w_1'\)。由于 \(I + D^{-\frac{1}{2}}SD^{-\frac{1}{2}}\) 可能导致数值不稳定,引入重归一化技巧,用 \(\hat{D}^{-\frac{1}{2}}\hat{S}\hat{D}^{-\frac{1}{2}}\) 替换 \(I + D^{-\frac{1}{2}}SD^{-\frac{1}{2}}\),其中 \(\hat{S} = S + I\),\(\tilde{D}_{ii} = \sum_{j} \tilde{S}_{ij}\)。
最终,我们得到样本数据 \(X \in R^{d×N}\) 及其非线性投影数据 \(Z = \hat{D}^{-\frac{1}{2}}\hat{S}\hat{D}^{-\frac{1}{2}}X^T \cdot W \in R^{N×d}\),还可添加偏置项 \(b\):
\[Z = \hat{D}^{-\frac{1}{2}}\hat{S}\hat{D}^{-\frac{1}{2}}X^T \cdot W + 1b^T\]
我们提出的算法不仅继承了谱图卷积的潜在优势,能缓解宽节点度分布图的局部邻域结构过拟合问题,还具备基于边界的判别嵌入和流形平滑性的优点。目标函数聚焦于非线性投影数据 \(Z\)、线性变换矩阵 \(W\) 和偏移向量 \(b\) 的联合估计,在约束条件下最小化以下函数:
\[h(Z, W, b) = \text{tr}(Z^T (L + \lambda \tilde{M}_l)Z) + \mu(\|W\|_2^2 + \gamma \|\hat{D}^{-\frac{1}{2}}\hat{S}\hat{D}^{-\frac{1}{2}}X^T \cdot W + 1b^T - Z\|_2^2)\]
\[s.t. Z^T \hat{D}_lZ = I\]
通过对目标函数关于 \(W\) 和 \(b\) 求导并令其为零,可得到:
\[b = \frac{1}{N} (Z^T 1 - W^T \hat{X}^T 1)\]
\
0
0
复制全文
相关推荐










