解决cd-hit-est 慢test1 & test2

最新推荐文章于 2025-04-07 20:47:54 发布

马志远的生信笔记

最新推荐文章于 2025-04-07 20:47:54 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：序列数据处理

本文链接：https://blog.csdn.net/weixin_42480153/article/details/106750021

序列数据处理专栏收录该内容

36 篇文章

订阅专栏

本文详细介绍了使用Mothur和Cd-hit-est等生物信息学工具进行基因序列筛选、聚类及去重的过程。通过一系列命令操作，从大量基因数据中筛选出特定样本的序列，并进行高质量序列的比对与聚类分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

test1

cd /mnt/10t/mzy/48samples/geneset/
for i in 123 126 134 131 125 140 132 149 148 122 143 133 145 152 118 147 121 151 135 136 150 146 141 137
cat all.fa| grep "$i\_\_"| sed 's/>//g' >$i.id
mothur "#get.seqs(accnos=$i.id,fasta=all.fa)"
mv all.pick.fa $i.all.fa
/mnt/10t/mzy/script/cd-hit-est -i $i.all.fa -o $i.fa -n 9 -c 0.95 -G 0 -M 0 -d 0 -aS 0.9 -r 0 -T 88
done
cat 123.fa 126.fa 134.fa 131.fa 125.fa 140.fa 132.fa 149.fa 148.fa 122.fa 143.fa 133.fa|cd-hit-est -o merged1.fa -T 88 -aS 0.9 -d 0 -n 9 -c 0.95 -G 0 -M 0 -r 1
cat 145.fa 152.fa 118.fa 147.fa 121.fa 151.fa 135.fa 136.fa 150.fa 146.fa 141.fa 137.fa|cd-hit-est -o merged2.fa -T 88 -aS 0.9 -d 0 -n 9 -c 0.95 -G 0 -M 0 -r 1
cat merged2.fa merged1.fa|cd-hit-est -o unique24.fa -T 88 -aS 0.9 -d 0 -n 9 -c 0.95 -G 0 -M 0 -r 1
mkdir cd /mnt/10t/mzy/24samples/geneset/
mv unique24.fa /mnt/10t/mzy/24samples/geneset/

test2

for i in 123 126 134 131 125 140 132 149 148 122 143 133 145 152 118 147 121 151 135 136 150 146 141 137
cat /mnt/10t/mzy/72sample/01assembly/contigs/$i.contig.ok.fa|prodigal -a $i.faa -d $i.fa
cat 123.fa 126.fa 134.fa 131.fa 125.fa 140.fa 132.fa 149.fa 148.fa 122.fa 143.fa 133.fa|cd-hit-est -o merged1.fa -T 88 -aS 0.9 -d 0 -n 9 -c 0.95 -G 0 -M 0 -r 1
cat 145.fa 152.fa 118.fa 147.fa 121.fa 151.fa 135.fa 136.fa 150.fa 146.fa 141.fa 137.fa|cd-hit-est -o merged2.fa -T 88 -aS 0.9 -d 0 -n 9 -c 0.95 -G 0 -M 0 -r 1
cat merged2.fa merged1.fa|cd-hit-est -o unique24.fa -T 88 -aS 0.9 -d 0 -n 9 -c 0.95 -G 0 -M 0 -r 1
mkdir cd /mnt/10t/mzy/24samples/geneset/
mv unique24.fa /mnt/10t/mzy/24samples/geneset/