代谢途径重建与基因网络逻辑模型分析
立即解锁
发布时间: 2025-08-20 02:03:08 阅读量: 1 订阅数: 2 


系统生物学中的计算方法:CMSB 2007会议论文集
# 代谢途径重建与基因网络逻辑模型分析
## 代谢途径的双向化学搜索重建
### 最短代谢途径的获取
在通过先前算法得到的代谢网络 (X, Y) 上,利用所有对最短路径算法,能够获取长度至多为 2k 的所有最短代谢途径。这些途径使用 R 中的代谢物和反应,起始和结束于 R 中反应所涉及的至多 m 种代谢物集合。例如,从与 bbb 兼容的初始化学图类 C = {c, ab, ad, ae, af} 通过长度至多为 4 的代谢途径双向搜索得到的人工化学示例中,对 (X, Y) 中起始和结束于 C 元素的所有对最短路径进行枚举,可得到一系列推导结果,如 c → ab、c → bbe → def → af 等。
### 实验方案与结果
代谢重建算法以 Perl 脚本实现,使用了 PerlMol 集合中用于计算化学的 Chemistry::Reaction 模块。为了重建所有已知参考途径图的代谢途径,采用了以下实验方案:
1. 从 KEGG 数据库获取参考途径图,实验使用的是 KEGG 42.0 版本。
2. 解决参考途径中所有反应的最优原子映射问题。
3. 为每个参考途径重建长度至多为 8 的代谢途径。
4. 根据 KEGG 中反应不可逆性的研究对反应进行定向。
5. 过滤掉涉及不可逆反应反向应用的代谢途径。
6. 通过在 CheBi、MetaCyc、KEGG 和 SciFinder Scholar 中进行化学结构搜索,识别新获得的代谢物。
7. 分析新代谢途径中代谢物和酶在每个特定生物体中的共存情况。
对 KEGG 中 322 个参考途径图中的 11 个进行实验,初步结果总结在表 1 中。以 β - 丙氨酸代谢 (00410) 参考途径图为例,为该途径注释的 34 个反应中的 16 个解决了最优原子映射问题,涉及 56 种代谢物中的 34 种,共有 629 个初始和最终分子。在双向化学搜索中,k = 1 时新代谢物数量为 1370 且获得 1 条新代谢途径;k = 2、3、4 时,新代谢物数量分别为 1566、2717 和 2058,但未发现更多新代谢途径,即总共生成 8340 个新代谢物时发现了 1 条新代谢途径。
| map | # cpd | # rn | k = 1 | k = 2 | k = 3 | k = 4 |
| --- | --- | --- | --- | --- | --- | --- |
| 00020 | 20/38 | 10/29 | 569 1 | 552 1 | 1,351 1 | |
| 00030 | 31/53 | 19/43 | 1,052 148 | 1,494 27 | 906 361 | 4,340 175 |
| 00120 | 31/62 | 18/46 | 2,148 2 | 1,102 3,777 | 2 | |
| 00251 | 20/51 | 9/36 | 237 1 | 38 1 | 506 1 | |
| 00260 | 61/91 | 32/66 | 934 2 | 406 288 | 67 3,647 | 2 |
| 00290 | 21/46 | 10/29 | 291 3 | 64 607 | 3 | |
| 00340 | 37/60 | 19/38 | 1,350 1 | 504 1 | 2,595 1 | |
| 00360 | 31/63 | 13/53 | 471 1 | 55 1,053 | 1 | |
| 00410 | 34/56 | 16/34 | 1,370 1 | 1,566 2,717 | 2,058 8,340 | 1 |
| 00590 | 43/76 | 20/64 | 2,545 30 | 2,278 1,859 | 1,927 9,598 | 30 |
| 00906 | 38/100 | 23/103 | 685 6 | 167 12 | 1,643 6 | |
### 新代谢途径示例
在类胡萝卜素生物合成 (参考途径图 00906) 中,通过双向搜索发现了一条新的代谢途径:
C14146 + C13455 => R06958 => C14146 + C13456
<= R06961
<= C08586 + C13456
即 α - 玉米黄质 + 脱落醛 => R06958 => α - 玉米黄质 + 脱落醇
<= R06961
<= δ - 胡萝卜素 + 脱落醇
由于 KEGG 途径参考图包含多个生物体的信息,因此需要找到证据证明该途径中的四种代谢物存在于同一生物体中,并且激活反向生化反应 R06961 的酶(胡萝卜素 7,8 - 去饱和酶,1.14.99.30)确实在该特定生物体中表达。实际上,拟南芥是唯一在 KEGG 中注释了这四种代谢物参与类胡萝卜素生物合成的生物体,并且编码胡萝卜素 7,8 - 去饱和酶的基因 AT3G04870 确实在拟南芥中表达。
### 潜在生化反应分析
尽管初步结果已揭示了一些新的生化途径,但从反应集合中涉及的至多 m 种代谢物集合开始的人工化学重建(重建过程中的第三个
0
0
复制全文
相关推荐








