上午
更改seurat对象的gene名称:
背景:我的数据是ENSG号的,后续分析不方便,需要修改为symbol名称的。
尝试1:修改 assays 中 counts 和 data 的行名称,虽然 rownames(seurat_obj) 会返回 symbol 形式,但是后续进行 NormalizeData 时会报错(Attempting to add a different number of cells and/or features) ,所以这个是行不通的。
并且参考 如何给Seurat对象的基因重命名?【基因名转换】2022-07-27 - 简书 (jianshu.com) 和seurat作者给的解释 How to change a gene name · Issue #1049 · satijalab/seurat · GitHub ,
决定重新先修改矩阵的名称,然后重新建立一个seurat对象。
下午
R中Factor类型数据的建立:
参考 R中因子(factor)_r语言factor函数-CSDN博客 ,例如将gene的symbol与ENSG号(需要提前对应好顺序)存为factor类型,可以使用下面的代码,会显示ENSG号及levels数目。
factor(gene_symbol, labels = gene_ENSG)
晚上
R中在字符里替换部分字符:
参考 经验 - R - 替换字符串中部分字符_r语言行名中_改成--CSDN博客 ,用类似于 gsub('.', '_', rownames(data)) 这个函数修改即可,(其中第一项是原字符,第二项是新字符),另外注意空格需要打一个空格在引号里(‘ ’)。
(另:碎碎念:我说怎么画出来的图长不一样,原来是因为数据矩阵长得不一样,应该有其他相同的因素,待我再探索一下)