生物信息学中RNA相互作用与药物相互作用预测方法研究
立即解锁
发布时间: 2025-08-21 00:32:20 阅读量: 2 订阅数: 13 

# 生物信息学中RNA相互作用与药物相互作用预测方法研究
## 一、miRNA - lncRNA相互作用预测
### 1.1 研究背景
在癌症研究中,非编码RNA,尤其是长链非编码RNA(lncRNA)和微小RNA(miRNA)与疾病密切相关。例如,肿瘤和非小细胞肺癌受miRNA和lncRNA调控。然而,癌症可能同时受多个基因共同调控,不同的miRNA和lncRNA之间也可能存在相互作用和调控关系,目前对多基因间相互作用的理解还不够充分。传统生物学实验耗时且昂贵,因此越来越多的计算预测方法被用于预测lncRNA - miRNA相互作用。
### 1.2 相关研究现状
近年来,已有一些计算方法用于识别miRNA和lncRNA之间的潜在关联。如Dario Veneziano等人更新了关于miRNA和lncRNA的生物医学数据详细调查;ZHOU等人基于已知RNA相互作用和属性构建的异质网络提出了GEEL方法来预测lncRNA - miRNA关联;Zhang等人使用线性邻域传播提出了SLNPM方法进行预测。
### 1.3 提出的新方法
本文提出了一种新方法,用于识别miRNA - lncRNA之间的潜在相互作用。在构建异质网络时,将节点预标记为五种不同类型,不考虑节点属性,更注重结构信息。采用GATNE模型(一种用于属性多重异质网络的表示学习模型)从网络结构全局考虑分子网络。
### 1.4 数据集
为了更好地识别lncRNA和miRNA之间的潜在相互作用,构建了包含miRNA、lncRNA、蛋白质、疾病和药物五种类型节点的分子网络。涉及9个数据库,对数据集进行了标识符统一、冗余消除和简化处理,最终网络中选择了6527个节点和105546个分子节点间的关联。具体节点和边的数量如下表所示:
| 节点类型 | 总数 |
| ---- | ---- |
| miRNA | 1022 |
| lncRNA | 769 |
| 药物 | 1025 |
| 疾病 | 2061 |
| 蛋白质 | 1649 |
| 关系类型 | 关联数量 | 数据源 |
| ---- | ---- | ---- |
| miRNA - lncRNA | 8347 | lncRNASNP2 |
| miRNA - 疾病 | 16427 | HMDD |
| miRNA - 蛋白质 | 4944 | miRTarBase |
| lncRNA - 疾病 | 1264 | lncRNASNP2 |
| 蛋白质 - 蛋白质 | 19237 | STRING |
| 蛋白质 - 疾病 | 25087 | DisGeNET |
| 药物 - 蛋白质 | 11107 | DrugBank |
| 药物 - 疾病 | 18416 | CTD |
| lncRNA - 蛋白质 | 690 | LncRNA2Target |
### 1.5 基于GATNE的结构信息提取
对于异质网络,节点、边和节点特征分别设为$G(V, E, A)$,其中$V = \{v_1, v_2, v_3, \ldots, v_n\}$,$E = \{e_{ij}|v_i, v_j \in V\}$,$A = \{x_i|v_i \in V\}$。GATNE是一种归纳嵌入算法,通过聚合不同层的邻居来生成当前节点的向量表示。
- **基础嵌入计算**:基础嵌入在不同层之间共享,计算公式为$N_i = T_z(x_i)$,其中$x_i$是节点向量,$T_z$是变换函数,$z$是节点类型。
- **边嵌入聚合**:引入GraphSAGE机制在同一层的不同级别聚合边嵌入。
- 第0级:$d^{(0)}_{i,r} = g_{z,r}(x_i)$
- 第$k$级:$d^{(k)}_{i,r} = aggregator([d^{(k - 1)}_{i,r}, \forall v_j \in N_{i,r}])$
其中$g_{z,r}$是变换函数,$k$是$v_i$的第$k$级邻居,$N_{i,r}$是$v_i$的邻居节点集。
- **自注意力机制**:采用自注意力机制通过不同层节点的嵌入来拼接表示构建。
- $D_i = [d_{i,1}, d_{i,2}, \ldots, d_{i,m}]$
- $a_{i,r} = softmax(w^T_r tanh(W_r D_i))^T$
- $u_{i,r} = \alpha_r M_r D_r
0
0
复制全文
相关推荐










