序列模式

最新推荐文章于 2025-06-16 19:34:33 发布

原创

最新推荐文章于 2025-06-16 19:34:33 发布 · 3.4k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#数据挖掘 #序列模式 #GSP #SPADE #PrefixSpan

序列模式是数据挖掘的一种，关注用户在不同时间点的交易行为。本文介绍了GSP、SPADE和PrefixSpan三种序列模式挖掘算法，包括它们的基本原理和区别。GSP通过连接和删除操作生成频繁序列，SPADE利用ID_list减少数据库扫描，而PrefixSpan通过前缀递归挖掘频繁序列。实验展示了这些算法如何找出频繁序列，但并未解决序列间时间间隔的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

什么是序列模式

这里写图片描述

Apriori处理的数据没有考虑每个客户在超市多次购物的情况。
序列模式：一个用户在不同时间点的交易记录就构成了一个购买序列，
N个用户的购买序列就组成一个规模为N的序列数据集.。
Apriori目的：挖掘出频繁集，找到其中的关联规则
对于Apriori处理的数据集设置支持度阈值为：2
则（面包机、面包）为频繁集
设置可信度为：0.7
则关联规则：面包机 ——> 面包
这条关联规则的意义：在一次交易中买了面包机，就很可能买面
序列模式目的：挖掘满足最小支持度的频繁序列
对于序列模式处理的数据集设置支持度阈值为：2
则<面包机面包> 为频繁序列
这条频繁序列的意义:如果一个顾客买了面包机，那么他以后就回来买面包
如果我来经营一家超市，通过Apriori算法，我需要将面包机与面包放在一起，通过序列模式，我知道如果一段时间内面包机卖了很多，我将多进货面包