20240124单细胞测序学习记录

本文讲述了如何在Seurat对象中将ENSG号转换为symbol名称,包括修改矩阵名称、处理Factor类型数据以及在R中替换字符的操作。作者还提到数据差异可能导致绘图结果不同,需进一步排查。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上午

更改seurat对象的gene名称:

背景:我的数据是ENSG号的,后续分析不方便,需要修改为symbol名称的。

尝试1:修改 assays 中 counts 和 data 的行名称,虽然 rownames(seurat_obj) 会返回 symbol 形式,但是后续进行 NormalizeData 时会报错(Attempting to add a different number of cells and/or features) ,所以这个是行不通的。

并且参考 如何给Seurat对象的基因重命名?【基因名转换】2022-07-27 - 简书 (jianshu.com) 和seurat作者给的解释 How to change a gene name · Issue #1049 · satijalab/seurat · GitHub ,

决定重新先修改矩阵的名称,然后重新建立一个seurat对象。

下午

R中Factor类型数据的建立:

参考 R中因子(factor)_r语言factor函数-CSDN博客 ,例如将gene的symbol与ENSG号(需要提前对应好顺序)存为factor类型,可以使用下面的代码,会显示ENSG号及levels数目。

 factor(gene_symbol, labels = gene_ENSG)

晚上

R中在字符里替换部分字符:

参考 经验 - R - 替换字符串中部分字符_r语言行名中_改成--CSDN博客 ,用类似于 gsub('.', '_', rownames(data)) 这个函数修改即可,(其中第一项是原字符,第二项是新字符),另外注意空格需要打一个空格在引号里(‘ ’)。

(另:碎碎念:我说怎么画出来的图长不一样,原来是因为数据矩阵长得不一样,应该有其他相同的因素,待我再探索一下)

今日总结

明日提醒

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值