关联规则
关联规则的归纳。
输入
- 数据:数据集
输出
- 匹配数据:符合条件的数据实例。
该组件实现了FP-growth(频繁模式挖掘算法),并针对少量项目的条件数据库进行了分桶优化。在生成分类规则时,它会为整个项目集生成规则,并跳过那些结果(consequent)与类别值不匹配的规则。
- 数据集的相关信息。
- 在“查找关联规则”中,可以设置规则归纳的条件:
- 最小支持度:整个规则(前提和结果)覆盖的数据集百分比。
- 最小置信度:在符合前提的实例中,同时符合结果的实例所占比例。
- 最大规则数:限制算法生成的规则数量。过多的规则会显著降低组件运行速度。
如果勾选“生成分类规则(项目集→类别)”,则组件仅生成结果(consequent)为类别值的规则。
如果开启“自动查找规则”,每次参数变更时组件都会重新运行搜索。对于属性较多的数据集,可能会较慢,因此建议在参数设置完成后手动点击“查找规则”。
- 通过以下条件筛选规则:<