linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)

本文为建树新手提供PhyML建树流程指导,包括序列准备、模型选择及建树验证等步骤,并建议先使用NJ法进行初步实验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PhyML利用氨基酸序列建树步骤

(核酸建树也可以作为参考)

前言:本文阅读对象适合建树新手,生物信息学高手请勿嘲笑,其中有什么错误还恳请指点。为什么要建树及其你要解决什么问题这里不做讨论,只是一个纯粹的建树过程,前期的序列收集过程自己费心,根据自己的需要来做。这里主要是最大似然法来建树,NJ法像mega这些软件中都有集成,最新的mega7也集成ML法,不过模型及各种参数不一定适合你,所以学习多种多种方法也是有用的,PhyML速度较慢,如果数列数量较多、步长检验次数多,等待时间会很长,有可能达到几十小时,也与电脑配置有关,一般时间都是以小时计数,所以要有心理准备,如果数据量大,推荐用RaxML或其他方法建树,它处理速度要比PhyML 快,不过RaxML是纯命令操作,对不熟悉命令及参数意义的人有一定难度,我只在linux 下操作过,在win下没有使用过。本文是用氨基酸建树过程,如果你是用核酸序列建树,也可以参考这个过程,核酸替代模型请用jmodeltest或其他同功软件计算。

由于PhyML计算过程比较长,做一遍比较耗时,推荐你用其他软件用NJ法先行试验建树,看看你选择的序列是否有效及符合你的预期结果,调整好序列后再用PhyML跑一遍看结果是否符合自己的要求。

PhyML有线上版本,只需要提交序列比对结果,设置模型参数,留下邮箱等待就会给你返回结果,不过时间不可控,根据自身情况选择线上还是本地自己建树。水平有限,如有错误遗漏恳请各位指点。如果在文库不能下载,可以去网盘下载,见文末。

●建树过程:序列准备-模型选择-建树及树的验证。

●环境准备:电脑^-^Windows或者Linux都可以(没试过mac,如果是mac环境,请参考

具体的操作手册)、ProtTest、PhyMl及序列比对的软件,线上或本地都可以。

1.序列准备:

在自己熟悉的数据库中(我自己比较熟悉Ncbi)上做blast,选取跟要建树蛋白同源的各物种序列,下载到本地,整合到一个fasta文件中,注意修改物种名称,字数最好不要太长,序列比对后.phy格式文件对文件名长度有限制(这个可能跟软件有关系,只要自己知道是什么物种,不至于混淆就行),注意规范性,fasta文件中最好除了>头标,字母及下划线不要有其他不相关的字符,因为如果后面你要用软件分析.phy文件的时候这些软件对.phy的格式要求比较变态,有其他多余字符它都会报错的(你如果在dos 下用命令合并文件请注意文件中最后一行的字符,请删除)。做序列分析,常用的分析软件有clustalW系列,mega也集成了蛋白比对工具,线上线下各种软件自由选择,区别不大,保存的格式可以选择多一点,主要是看你后续操作。如clustalx 比对可以保存的结果格式如图1所示。选中你希望的格式保存即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值