什么是PAL2NAL?
PAL2NAL是一个将蛋白质和对应的DNA(或mRNA)序列的多重序列比对转换为密码子比对的程序。该程序自动分配相应的密码子序列,即使输入的DNA序列与蛋白质序列不匹配,或包含UTR(非翻译区)和多腺苷酸尾巴。它还可以处理输入比对中的帧移问题,非常适合伪基因的分析。生成的密码子比对可以进一步用于计算同义(dS)和非同义(dN)突变率。
如果输入的是一对序列,PAL2NAL会使用PAML中的codeml程序自动计算dS和dN。
更新内容
-
2011年12月2日:更新到版本14,扩展了密码子表(现在覆盖了所有NCBI的密码子表)。
-
2010年7月26日:更新到版本13。
-
2009年9月8日:在计算dS和dN时,还报告了同义(S)和非同义(N)位点的数量。
-
2009年4月3日:为PAL2NAL提供了京都大学的新镜像站点。
-
2007年2月5日:更新到版本12。输入文件1和2中使用相同的ID时,序列的顺序不再需要一致。优化了部分程序,处理速度比之前更快。如果出现错误(“蛋白质和核酸不一致”),脚本会自动运行bl2seq来显示蛋白质和DNA序列不匹配的原因。
下载
https://www.bork.embl.de/pal2nal/distribution/pal2nal.v14.tar.gz
在线版
https://www.bork.embl.de/pal2nal/
运行PAL2NAL(尝试示例)
输入文件 1
上传您的蛋白质多重序列比对(CLUSTAL格式或FASTA格式)。系统会自动检测文件格式。
在CLUSTAL格式中,您可以通过在比对中使用'#'选择特定位置。
输入文件 2
上传您的DNA(或mRNA)序列(FASTA格式)。
选项设置
-
密码子表:从多个密码子表中选择(例如,通用代码、脊椎动物线粒体代码、酵母线粒体代码等)。
-
移除间隙、框架内终止密码子:选项以移除比对中的间隙和终止密码子。
-
计算dS和dN:计算同义(dS)和非同义(dN)突变率(仅在输入为一对序列时有效)。
-
移除不匹配:移除蛋白质和DNA之间的不匹配密码子。
-
仅使用选定位置:仅使用在输入比对中标记为'#'的位置。
-
输出格式:选择输出为CLUSTAL、PAML、FASTA或带有氨基酸的密码子格式。
结果
参考文献
- Mikita Suyama, David Torrents, and Peer Bork (2006)
PAL2NAL: robust conversion of protein sequence alignments into the corresponding codon alignments.
Nucleic Acids Res. 34, W609-W612.