学生反馈情感学习与聚类方法探索
立即解锁
发布时间: 2025-08-22 01:54:07 阅读量: 2 订阅数: 5 


自适应与智能系统:ICAIS 2014精选论文集
### 学生反馈情感学习与聚类方法探索
在当今的教育和数据处理领域,从学生的文本反馈中学习情感以及对分类数据库进行聚类是两个重要的研究方向。下面将详细介绍相关的研究内容和方法。
#### 从学生文本反馈中学习情感
研究人员对四种机器学习方法(朴素贝叶斯、互补朴素贝叶斯、最大熵和支持向量机)从学生文本反馈中学习情感的能力进行了研究。使用了一个包含1036个教学相关反馈实例的数据集,该数据集由3位专家进行标注,并尝试使用一元语法作为特征以及一系列标准预处理技术。
##### 分类器性能比较
|分类器|有无中性类|准确率|精确率|召回率|F值|
| ---- | ---- | ---- | ---- | ---- | ---- |
|朴素贝叶斯|有|0.01|0.00|0.00|0.00|
|朴素贝叶斯|无|0.00|0.00|0.00|0.00|
|互补朴素贝叶斯|有|0.00|0.01|0.00|0.00|
|互补朴素贝叶斯|无|0.02|0.10|0.00|0.10|
|最大熵|有|0.00|0.91|0.07|0.26|
|最大熵|无|0.00|1.00|0.10|0.75|
|线性支持向量机|有|0.05|0.05|0.01|0.06|
|线性支持向量机|无|0.10|0.34|0.10|0.34|
|多项式支持向量机|有|0.00|0.00|0.00|0.00|
|多项式支持向量机|无|0.00|0.00|0.00|0.00|
|径向基支持向量机|有|0.00|0.106|0.00|0.00|
|径向基支持向量机|无|0.00|0.109|0.00|0.00|
从上述表格可以看出,最大熵分类器在使用中性类时准确率显著提高,但在精确率、召回率和F值方面没有显著差异。朴素贝叶斯分类器在使用中性类时准确率显著提高,但精确率、召回率和F值显著降低。对于大多数分类器来说,不使用中性类时评估指标(准确率、精确率、召回率和F值)有所提高,这可能是由于中性类的训练实例数量较少(1036个实例中只有103个)。
##### 是否使用中性类的讨论
- **不使用中性类**:这似乎符合人们在有强烈观点时(积极或消极)才表达意见的倾向,而不是在对主题没有特定看法时(中性)表达意见。因此,意见挖掘通常不考虑中性类,因为它被视为缺乏意见。
- **使用中性类**:可以防止过拟合问题,并且能提供更完整的数据图景,因为缺乏情感的情况与积极和消极类一样重要。
研究人员将继续研究在教育领域使用中性类的情况,不仅从分类器性能的角度,还从用户(即讲师)的角度,考虑了解有多少学生对他们的教学持中立观点的实用性。
##### 测试结果比较
在查看t检验和二项式检验结果时,48个实例中只有3个实例这两种测试结果存在分歧,t检验表明存在显著差异,而二项式检验表明差异不显著。
#### 分类数据库的聚类方法
在分类数据库的聚类方面,提出了一种新的聚类方法——递减粗糙可能性k模式(D - RPKM)。
##### 相关理论基础
- **可能性理论**:由Zadeh提出,用于处理不完美数据。假设存在一个论域Ω = {ω1, ω2, ..., ωn},可能性分布函数π将[0, 1]范围内的值与状态ωi相关联。基于π,定义了归一化、完全知识和完全无知的情况。此外,π还用于定义一个著名的可能性相似性度量InfoAff,用于计算两个归一化可能性分布之间的相似度。
- 归一化:maxi {π (ωi)} = 1
- 完全知识:∃一个唯一的ω0,π (ω0) = 1,π (ω) = 0,否则
- 完全无知:∀ω ∈Ω,π (
0
0
复制全文
相关推荐










