基因表达数据聚类与图像隐写技术研究
立即解锁
发布时间: 2025-08-20 00:55:17 阅读量: 1 订阅数: 3 


应用算法:首届ICAA 2014会议论文集
### 基因表达数据聚类与图像隐写技术研究
在生物信息学和图像处理领域,基因表达数据聚类和图像隐写技术是两个重要的研究方向。下面将分别介绍基因表达数据聚类的相似性度量方法以及基于霍夫曼编码的图像隐写技术。
#### 基因表达数据聚类的相似性度量
在基因表达数据聚类中,需要一种有效的相似性度量方法来衡量基因之间的相似程度。这里介绍的 PWCTM(Pairwise Changing Tendency Measure)就是这样一种方法。
##### 1. 相似性度量基础
通过一系列数学推导证明了 $d(g, g')$ 定义了一个距离函数,相似性函数 $s(g, g') = 1 - d(g, g')$ 基于这个潜在的距离函数。为了方便设置阈值,将相似性值以百分比形式表示。如果两个表达谱的变化趋势完全相同,根据 PWCTM 它们的相似度为 100%;如果变化趋势完全不同,则相似度为 0%。此外,通过累加一个表达中为 U 而另一个对应位置为 D 以及反之情况的权重,可以得到两个表达谱的负相关性得分。
##### 2. 性能评估
为了验证 PWCTM 的有效性,进行了以下实验:
- **实验设置**:使用 k-means 算法结合 CVAP3.7 工具进行聚类验证,在多个微阵列数据集上测试 PWCTM,并与皮尔逊相关系数、斯皮尔曼相关系数、Biosim 度量和欧几里得距离进行比较。PWCTM 用 MATLAB 实现,测试平台为 HP 工作站,配备 Intel(R) Core(TM) i3 CPU @2.40 GHz 处理器和 2 GB 内存,运行 Windows 7 操作系统。
- **验证方法**:设计了三种验证程序,分别是使用轮廓系数(Silhouette index)进行内部验证、使用 z-score 进行生物学验证以及使用 z-score 和 p-value 进行统计验证。
| 数据集编号 | 数据集名称 | 基因数量 | 条件数量 | 来源 |
| --- | --- | --- | --- | --- |
| 1 | Yeast CDC28 - 13 | 6214 | 17 | http://yscdp.stanford.edu/yeast cell cycle/full data.html |
| 2 | Subset of Yeast Cell Cycle | 384 | 17 | http://faculty.washington.edu/kayee /cluster |
| 3 | Yeast Diauxic Shift | 6
0
0
复制全文
相关推荐







