大规模时间序列聚类与新闻网络演化模式挖掘
立即解锁
发布时间: 2025-08-20 01:07:08 阅读量: 1 订阅数: 7 


智能技术与计算智能前沿进展
### 大规模时间序列聚类与新闻网络演化模式挖掘
在当今的数据处理领域,大规模时间序列聚类和新闻网络演化模式挖掘是两个备受关注的重要方向。前者有助于我们对大量时间序列数据进行有效的分类和分析,而后者则能帮助我们从新闻网络中发现有价值的动态模式。
#### 大规模时间序列聚类算法
传统的大规模时间序列聚类方法往往存在时间复杂度高的问题,并且现有的算法大多缺乏利用已有经验和知识的机制。为了解决这些问题,研究人员提出了一种知识引导的聚类方法,结合了水平协作模糊C均值(HC - FCM)算法。
在介绍新的聚类算法之前,我们先来了解一些必要的基础知识。
- **FCM算法**:假设要将N个模式聚类到c个簇中,每个模式由n维向量描述,所有N个向量构成数据集X。通过求解一个优化问题来实现聚类,目标是最小化一个目标函数$Q$,同时满足一定的约束条件。最优的划分矩阵$U$和原型向量$V$可以通过循环迭代公式得到。
- **HC - FCM算法**:当不同组织的数据集之间存在交互关系时,需要考虑其他数据集对当前聚类数据集结果的影响。HC - FCM算法通过结合从其他数据集获得的关于相同模式的知识,在不同特征空间中实现对数据集的聚类。
- **Haar小波变换**:这是一种从空间域到局部频率域的简单基本变换。对于满足$n = 2^j$($j$为整数)的时间序列$X$,Haar小波变换的步骤包括:
1. 平均:计算相邻时间序列值的平均值,得到低分辨率的时间序列。
2. 差分:记录原始时间序列的缺失信息,得到相应的细节系数。
3. 递归:重复上述步骤,直到时间序列的维度降为1。
基于以上基础知识,研究人员提出了知识引导的小波聚类算法,具体步骤如下:
1. **问题描述**:给定一个由N个等长为n的大规模时间序列组成的数据集X,以及所有聚类问题的共同簇数c。
2. **分割**:按时间顺序将X分割成p + 1个新的子序列组X[jj],每个组描述相同的N个模式,但在不同的特征空间中,维度为n[jj]。
3. **小波变换**:对每个X[jj]应用Haar小波变换,得到新的组$X'[jj]$。
4. **初始化**:选择交互系数$α[jj]$、距离函数和最大迭代次数itermax,使用公式初始化划分矩阵$U[jj]$、原型向量$V[jj]$。
5. **迭代阶段**:通过公式计算新的原型和划分矩阵,迭代次数加1,直到达到最大迭代次数。
为了验证新算法的性能,研究人员进行了两个实验:
- **实验I**:比较知识引导的小波聚类算法和FCM算法的划分矩阵差异。结果表明,新算法在不同协作水平系数下的结果都接近FCM算法,具有良
0
0
复制全文
相关推荐










