序列模式规则生成与监督学习技术解析

# 序列模式规则生成与监督学习技术解析 ## 1. 序列模式规则生成 ### 1.1 生成序列模式给定序列数据库，通过特定算法生成序列模式。例如，对于序列集合 \(S1 = \{〈\{40\}\{30\}\{40, 60\}〉, 〈\{30\}\{20, 40\}\{40, 100\}〉, 〈\{40\}\{30\}\{110\}〉\}\)，运行 \(r - PrefixSpan(30, S1, 3)\) 算法： - 频繁项为 30 和 40，支持度均为 3 个序列。 - 长度为 1 的频繁序列仅为 \(〈\{30\}〉\)，因为要求每个频繁序列必须包含 30，所以 \(〈\{40\}〉\) 不包含在内。 - 以 \(〈\{30\}〉\) 为前缀，投影数据库 \(S1\) 得到 \(〈\{40\}〉\) 和 \(〈\{40\}\{40\}〉\)，移除支持度小于 3 的项 20、60 和 100，得到长度为 2 的频繁序列 \(〈\{30\}\{40\}〉\)。 - 以 \(〈\{40\}〉\) 为前缀，投影 \(S1\) 得到 \(〈\{30\}\{40\}〉\) 和 \(〈\{30\}〉\)，得到另一个长度为 2 的频繁序列 \(〈\{40\}\{30\}〉\)。经过多次迭代，最终从序列数据库生成的序列模式集合为 \(\{〈\{30\}〉, 〈\{20\}〉, 〈\{40\}〉, 〈\{40\}\{30\}〉, 〈\{30\}\{40\}〉\}\)。 ### 1.2 生成规则类型经典的序列模式挖掘不生成规则，但可以定义和生成多种类型的规则，主要介绍以下三种： #### 1.2.1 序列规则（Sequential Rules，SR） - 形式为 \(X \to Y\)，其中 \(Y\) 是序列，\(X\) 是 \(Y\) 的真子序列，即 \(X\) 是 \(Y\) 的子序列且 \(Y\) 的长度大于 \(X\) 的长度。 - 规则 \(X \to Y\) 在序列数据库 \(S\) 中的支持度是 \(S\) 中包含 \(Y\) 的序列所占比例；置信度是 \(S\) 中包含 \(X\) 的序列同时包含 \(Y\) 的比例。例如，给定序列数据库（表 2.6），最小支持度为 30%，最小置信度为 60%，找到的一个序列规则为 \(〈\{1\}\{7\}〉 \to 〈\{1\}\{3\}\{7, 8\}〉\)，支持度为 \(2/5\)，置信度为 \(2/3\)。 | 数据序列 | | --- | | \(〈\{1\}\{3\}\{5\}\{7, 8, 9\}〉\) | | \(〈\{1\}\{3\}\{6\}\{7, 8\}〉\) | | \(〈\{1, 6\}\{7\}〉\) | | \(〈\{1\}\{3\}\{5, 6\}〉\) | | \(〈\{1\}\{3\}\{4\}〉\) | #### 1.2.2 标签序列规则（Label Sequential Rules，LSR） - 形式为 \(X \to Y\)，其中 \(Y\) 是序列，\(X\) 是由 \(Y\) 替换部分项为通配符“*”得到的序列。 - 通配符“*” 可匹配任何项，被替换的项通常是重要的标签。例如，给定上述序列数据库，最小支持度为 30%，最小置信度为 60%，找到的一个标签序列规则为 \(〈\{1\}\{*\}\{7, *\}〉 \to 〈\{1\}\{3\}\{7, 8\}〉\)，支持度为 \(2/5\)，置信度为 \(2/2\)，其中 3 和 8 是标签。 #### 1.2.3 类序列规则（Class Sequential Rules，CSR） - 形式为 \(X \to y\)，其中 \(X\) 是序列，\(y\) 是类标签。 - 数据实例 \((s_i, y_i)\) 覆盖规则 \(X \to y\) 表示 \(X\) 是 \(s_i\) 的子序列；满足规则表示 \(X\) 是 \(s_i\) 的子序列且 \(y_i = y\)。例如，给定序列数据库（表 2.7），最小支持度为 30%，最小置信度为 60%，找到的一个类序列规则为

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

序列模式规则生成与监督学习技术解析

相关推荐

专栏目录

序列模式规则生成与监督学习技术解析

相关推荐

ChatGPT的文本生成算法解析.docx

ChatGPT的基本原理与算法解析.docx

基于深度学习的d地震数据处理.zip

通信技术试题与解析：分组码、信源编码与序列生成

深入理解机器学习：监督/无监督学习与深度学习技术及应用解析

脉冲神经网络监督学习算法深度解析与挑战

人工智能与机器学习技术解析

自然语言处理中的词嵌入与序列模型技术解析

【序列标注】：NLP深度学习应用详解——R085技术深度解析

机器学习方法全解析：从监督到无监督学习

基于粒子群算法的局部遮阴光伏MPPT仿真技术研究与视频解析

专栏目录

最新推荐

Rust开发实战：从命令行到Web应用

iOS开发中的面部识别与机器学习应用

Rust模块系统与JSON解析：提升代码组织与性能

React应用性能优化与测试指南

AWS无服务器服务深度解析与实操指南

Rust编程：模块与路径的使用指南

并发编程中的锁与条件变量优化

Rust应用中的日志记录与调试

Rust项目构建与部署全解析

Rust数据处理：HashMaps、迭代器与高阶函数的高效运用