- 博客(10)
- 收藏
- 关注
原创 【数据下载】 NCBI SRR 数据下载
最后在https://ftp.sra.ebi.ac.uk/vol1/fastq/SRR283/087/SRR28305187/ 网站上直接找到了原始下载链接。后续需要下载可以直接根据ID来这个网站上找一找。能直接下载的只有SRA和SRA Lite 格式的,但需要依赖SRA tools 来转换,同时还需要ncbi certificate。有些SRA数据的数据没有提供原始数据fq.gz的下载链接,显示存在aws云上,好不容易建立了aws账户和bucket,ncbi又说我的bucket未开放授权。
2025-07-31 12:08:06
189
原创 R 添加使用mac字体
R 添加mac字体#安装,加载showtext包> install.packages(showtext)> library(showtext)# 查看R已安装字体> font_families()[1] "sans" "serif" "mono" "wqy-microhei"发现只要少数几个字体,如果我们想使用mac系统已有字体,比如Times New Roman,可以从/System/Library/Fonts/ 中找到l
2021-12-27 17:48:17
3212
原创 下载外网大文件神器 mac window 都行
工具地址:Neat Download Manager for Mac and Windows (Free Internet Download Manager Mac & Windows )setting那里把segments改到最大 32直接New URL那里填要下载的文件网址14G的大文件下载时间从2天缩短到2小时mac用户注意自己存储余量。。 需要的存储是下载文件的2倍以上,要不然会merge失败喔...
2021-09-24 10:50:17
1448
原创 【R】R画图不显示中文问题
系统mac os 11RstutioVersion1.2.1335RVersion3.6.2画图里的中文一直显示成方框。ggplot()+geom_point(aes(x=ta1$X2011年,y=ta1$X2012))+ xlab("2011年")+ylab("2021年")解决方案:使用showtext。install.packages("showtext", repos = "https://mirrors.ustc.edu.cn/CRAN/")in...
2021-01-06 18:03:43
11383
3
原创 【perl】perl 同时读取2个文件
perl 读取两个相同列的文件perl 读取两个相同列的文件,进行一对应列的计算。可以使用hash,但文件很大的时候不太适用,因为hash占内存很大。$cat A.file.txtname numA 22B 33$cat B.file.txtname numA 11B 23open(f1, "<data1");open(f2, "<data2");# initialize hashes%data1 = ();%data2 = ();while(($li.
2020-11-02 17:34:10
1526
原创 【linux】一些我经常忘记但是很有用的Linux技巧,持续更新
1.vi 多行注释与取消:注释步骤:-》“Esc”键->-》"Ctrl + v" -》-》I -》-》注释取消:esc -》 Ctrl + v -》光标移动选定要取消注释的行 -》按下“x”或者“d”2.shell 变量嵌套HG001=/ftp-trace.ncbi.nih.gov/giab/ftp/release/NA12878_HG001/latest/GRCh38/HG001_GRCh38_GIAB_highconf_CG-IllFB-IllGATKHC-Io...
2020-10-29 15:00:53
210
原创 【生信分析笔记】GATK GenotypeConcordance:Sequence dictionaries are not the same size (25, 195)
分析时需要将数据与GIAB金标准集进行比较,GenotypeConcordance有报错:my script:time /gatk/4.1.7.0/gatk GenotypeConcordance \--CALL_VCF myvcf.gz \--TRUTH_VCF /GIAB/ftp-trace.ncbi.nih.gov/giab/ftp/release/AshkenazimTrio/HG002_NA24385_son/latest/GRCh38/HG002_GRCh38_GIAB_highco
2020-10-29 09:22:40
803
原创 【生信笔记】gvcf 和 vcf文件中的星号 * 是啥意思
分析的时候ALT中出现了*,(如下)懵逼。#CHROM POS ID REF ALT QUAL FILTER INFO FORMATchr9 10105 rs575580161 C *,A 180.66 VQSRTrancheSNP99.50to99.90 AC=3,2;AF=1.280e-03,8.532e-4;AN=2344;DB;DP=1886;ExcessHet=0;FS=0;InbreedingCoeff=0.331;MQ=40.98;NEGATIVE_TRAIN_SITE;PG=0,28
2020-10-26 16:12:10
5546
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人