如何从NCBI上下载SRA数据
1、获取BioProject
点击SRA Run Selector 跳转并获取BioProject
2、获取到下载表单
通过在EBI上查询需要下载的list
一定注意在这个地方我通过aspera下载,所以在Read Files处需要勾选几个选项
获取到了TXV文件后我们需要对内容修改成我们需要的格式,首先文件格式是.TXT 使用EXCEL打开,处理成下图所示的文件
处理步骤如下:
1、打开下载的.TXT文件,图中红色方框中的数据是我们需要的数据
2、第一步直接替换成空
3、第二步使用Notepad++把分号替换成换行,查找模式是扩展,替换为\r\n
处理号后就可以直接使用aspera批量下载数据
3、aspera下载数据
批量下载数据;准备链接索引文件(sra_list.txt),运行以下代码:ascp -T -i <path>//asperaweb_id_dsa.openssh -k 1 -l 200m --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp --file-list ./sra_list.txt ./
`