基于类组织P系统的增强图神经网络
立即解锁
发布时间: 2025-08-21 00:32:19 阅读量: 6 订阅数: 18 

### 基于类组织P系统的增强图神经网络
#### 1. 引言
膜计算,也称为P系统,是自然计算的一个新分支。它受生物细胞的功能和结构启发而提出,主要分为细胞类P系统、类组织P系统、类神经P系统和动态P系统。细胞类P系统模仿细胞的结构和功能,多组化学物质(对象)按给定进化规则演化;类组织P系统是细胞P系统的扩展模型,由多个细胞组成,结构类似图结构,节点对应细胞,边对应细胞间的通信通道;类神经P系统是新提出的计算模型,包括基本神经P系统和脉冲P系统。P系统最初的研究多与计算能力相关,现已证明其计算能力与图灵机相当,甚至可能超越图灵机的限制,后来其应用领域的研究逐渐展开,涵盖生物学、优化和计算机科学等。
图是一种特殊的数据结构,将现实世界中的事物抽象为节点,事物间的联系用边表示,如社交网络中的友谊图、生物学中的蛋白质 - 蛋白质相互作用图、推荐系统中的用户 - 物品关系图等。图神经网络在处理图和图分析任务,如节点分类、链接预测和图分类等方面取得了显著成果。其核心思想是聚合邻居节点的特征来更新节点嵌入,像GCN在聚合邻居信息时进行图卷积并使用归一化邻接矩阵;GraphSAGE改进了GCN的归纳学习局限性,采用归纳学习方式,不采样节点的所有邻居,而是选择部分邻居,提高了计算效率,并引入聚合函数来聚合邻居的特征信息;GAT引入注意力机制,通过自注意力计算所有节点间的相似度,使用掩码注意力为不同节点分配不同权重,以获得信息丰富的节点特征表示。
然而,这些方法都基于节点所有邻居信息都有益的假设,但在学习节点v的嵌入表示时,若邻居节点类别与节点v不同,这种噪声信息会对正确分类产生不利影响,我们将连接节点v与这些节点的边称为有害的类间边;若邻居节点与节点v属于同一类,在极端情况下,节点v及其邻居的类别都相同,聚合邻居信息对学习节点v的嵌入就没有意义,我们将连接节点v与这些节点的边称为冗余的类内边。虽然已有一些研究尝试解决这个问题,如FastGCN应用基于控制变量的算法可任意采样邻居,Rong等人提出的DropEdge在每个训练周期随机移除一定数量的边,但这些方法随机性较大。因此,有必要提出一种新方法应用于GNN模型的邻居聚合特征信息过程,以获得信息丰富的节点嵌入表示,从而提高GNN的节点分类准确率。
为解决上述问题,我们提出了基于类组织P系统的增强图神经网络(EGNN - P),将优化邻居信息聚合的过程集成到类组织P系统中,以提高GNN的性能。P系统具有最大并行性,类组织P系统的膜结构与图相似,由节点和边组成,将GNN的实现集成到类组织P系统中可大大提高计算效率。该方法的核心思想是在训练周期中通过移除节点间的传播路径来去除邻居收集的有害信息,具体来说,基于真实标签和可能的伪标签,在聚合节点的邻居信息时移除有害的类间边和冗余的类内边,从而获得准确的节点嵌入表示,提高GNN的分类性能。
本文的主要贡献如下:
- 构建了一种新颖的类组织P系统,将优化邻居信息聚合的过程集成到类组织P系统中。
- 提出EGNN - P,通过移除有害的类间边和部分冗余的类内边,减少包含有害或无意义信息的邻居节点的聚合。
- 在三个引文网络上的实验表明,所提出的EGNN - P提高了GNN模型在节点分类上的准确性。
#### 2. 相关工作
##### 2.1 图神经网络
近年来,深度学习方法在处理欧几里得数据方面取得了很大进展,但非欧几里得数据的数量不断增加,传统深度学习方法不适用于非欧几里得数据,因此图神经网络应运而生。受计算机视觉中卷积网络成功的启发,图卷积神经网络得到了快速发展,主要分为基于空间的图卷积网络和基于谱的卷积网络。由于GCN是归纳学习,在处理新节点时学习节点嵌入较慢,Hamilton等人提出了GraphSAGE,它是一种归纳框架,通过采样节点的局部邻居并聚合其特征来生成嵌入。GAT是一种引入注意力机制的图卷积网络,在聚合邻居信息时使用掩码注意力为不同节点分配不同的权重系数。
一般来说,GNN学习每个节点的隐藏表示,可表示为:
\[H = f (A, X )\]
其中映射函数\(f (·)\)是\(A\)和\(X\)的函数,\(H\)是节点的隐藏表示。对于半监督分类,通过对节点的隐藏表示应用softmax激活函数得到预测标签\(\tilde{y}\),预测标签\(\tilde{y}\)与真实标签\(y\)之间的损失,我们使用交叉熵损失函数来衡量:
\[L = -\sum_{i\in V_t}\sum_{c = 1}^{C}y_{i}^{c}\ln\tilde{y}_{i}^{c}\]
其中\(V_t\)表示有标签的节点,\(C\)是类的数量,\(y_i\)是节点\(i\)的真实标签。
##### 2.2 类组织P系统
类组织膜结构用图来描述,其中细胞是图的节点,两个节点之间的边对应细胞之间的通信通道。类组织P系统的基本膜结构如图1所示。在类组织P系统中,对象通过细胞间的通道进行通信,在每个转换步骤中,我们对每个通道应用规则。
形式上,类组织P系统的定义为:
\(\varPi = (O, \mu, \sigma_1, \ldots, \sigma_m, syn, i_{out})\)
- \(O\)是字母表,包含系统中的所有对象。
- \(\mu\)是由\(m\)个膜组成的膜结构。
- \(\sigma_1, \ldots, \sigma_m\)表示系统中的\(m\)个细胞,具体定义如下:
- \(\sigma_i = (Q_i, s_{i,0}, obj_{i,0}, r_i)\),\(1 \leq i \leq m\)
- \(Q_i\)是\(\sigma_i\)中的状态集。
- \(s_{i,0} \in Q_i\)是初始状态。
- \(obj_{i,0}\)表示对象的初始多重集,当\(obj_{i,0} = \lambda\)时,细胞\(i\)中没有对象。
- \(r_i\)是\(\sigma_i\)细胞的规则集。
- \(syn\)是细胞之间的突触,是细胞通信的通道。
- \(i_{out}\)指定\(\varPi\)的输出膜。
```mermaid
graph LR
0 --> 1
0 --> 2
1 --> 2
2 --> 1
2 --> 3
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
style 0 fill:#ffffff,stroke:#000000,stroke-width:2px
```
0
0
复制全文
相关推荐










