反卷积的概念
由于许多组织样本不适合分解成单个细胞,因此不能利用单细胞RNA测序技术对它们的单个细胞进行测序。但是对于整个组织进行RNA测序是很容易的事情,而反卷积所做的就是由整体来探测局部,从而获知整个组织中的细胞类型,比如说了解实体肿瘤的特异性免疫细胞组成等等。
反卷积的具体方式
反卷积预测RNA序列
由于测序数据具有异方差性(对于不同的组织其线性模型中干扰项的方差不同)和呈离散分布的特性,因此线性模型不适合于进行预测。
负二项分布是统计学上一种描述在一系列独立同分布的伯努利试验中,失败次数到达指定次数(记为r)时成功次数的离散概率分布。
我们使用负二项模型来解释RNAseq数据中的二次均值 - 方差关系,并使用基因特异性方差估计。
知识背景
载体(Vector)
指在基因工程重组DNA技术中将DNA片段(目的基因)转移至受体细胞的一种能自我复制的DNA分子。三种最常用的载体是细菌质粒、噬菌体和动植物病毒。
基因文库
主要有两种基因文库:基因组文库和cDNA文库。
基因组文库:一个生物体的基因组DNA用限制性核酸内切酶部分酶切后,将酶切片段插入到载体DNA分子中,所有这些插入了基因组DNA片段的载体分子的集合体,将包含这个生物体的整个基因组,也就是构成了这个生物体的基因