生物序列分析中的种子计算与逆序列比对技术
在生物序列分析领域,快速计算优质的多间隔种子以及准确确定序列比对的参数值是两个关键问题。前者对于同源性搜索至关重要,而后者则直接影响序列比对的准确性。下面将详细介绍这两方面的相关技术和方法。
快速计算优质多间隔种子
在同源性搜索中,多间隔种子的引入带来了革命性的变化。以往寻找最优种子的计算难度较大,因此人们一直在寻求更快的方法来找到次优但仍然优质的种子。
- 种子敏感性比较
|相似度水平|60%|65%|70%|75%|80%|
|—|—|—|—|—|—|
|Li等人的16个权重为11的种子|0.566640|0.781508|0.924114|0.984289|0.998449|
|相同权重、等长的16个种子|0.565971|0.780308|0.922707|0.983500|0.998265|
|相同权重、更优的16个种子|0.575998|0.790088|0.929016|0.985849|0.998676|
|相同权重的15个种子|0.564483|0.780967|0.924398|0.984530|0.998504|
|相同权重的32个种子|0.695484|0.874409|0.966406|0.995014|0.999679|
从表格数据可以看出,不同类型的种子在不同相似度水平下的敏感性有所差异。其中,相同权重的32个种子在各个相似度水平下的敏感性相对较高。
-
计算方法与重点
交换