流程挖掘与数据质量依赖发现的研究进展
立即解锁
发布时间: 2025-08-22 01:59:12 阅读量: 2 订阅数: 12 


计算机科学讲义6051:编辑委员会与内容概览
### 流程挖掘与数据质量依赖发现的研究进展
在当今的信息时代,流程挖掘和数据质量问题对于组织的决策和运营至关重要。本文将探讨流程挖掘在运营决策中的应用,以及如何发现数据质量维度之间的依赖关系。
#### 流程挖掘在运营决策中的应用
流程挖掘的研究主要集中在被动形式,如流程发现。然而,这些方法并非本文的重点。本文提出了一种全面的方法,不仅支持预测,还包括基于时间的一致性检查和基于时间的推荐。
##### 相关工作
- **现有尝试**:一些研究尝试使用流程挖掘技术或模拟来支持运营决策。例如,在YAWL环境中结合了这两种技术,还有使用非参数回归来预测完成时间。
- **推荐服务**:ProM中实现了一个推荐服务,利用历史信息指导用户选择下一个工作项,这与基于案例的推理相关。
- **运行时支持**:在万维网环境中,有多种运行时支持方法,如基于业务规则的监控、BPEL和事件演算等。
##### 主要贡献
本文提供了一个框架,用于定位各种类型的流程挖掘,并详细说明了对正在运行的流程进行通用运营支持的方面。这种观点在ProM的新版本中得到了支持。
##### 结论
本文聚焦于流程挖掘在运营决策中的应用,提出了一个通用框架,并描述了一组用于基于时间的运营支持的ProM插件。未来,希望添加更多技术,并将其应用于选定的领域。
#### 数据质量依赖发现
数据质量和质量维度之间的依赖关系在组织的决策和运营中变得越来越重要。了解这些依赖关系对于做出正确的决策和规划活动至关重要。
##### 引言
过去二十年,对数据质量维度之间潜在依赖关系的研究较少。然而,如今这些关系对于组织的决策支持系统和管理信息系统的有效性至关重要。
- **依赖关系示例**
- **准确性和及时性**:信息可能随着时间变得更准确,但也可能变得不那么相关。例如,空中交通控制中心需要平衡接收更准确数据的延迟和做出有效决策的关键时间。
- **一致性与完整性**:信息可能基于不完整但一致的数据,或完整但不太一致的数据。例如,人力资源数据中不同评估者提供的信息可能存在差异。
##### D3Q框架
本文提出了Dependency Discovery in Data Quality (D3Q) 框架,用于发现数据质量维度之间的依赖关系。该框架可以作为额外的层添加到任何数据质量评估解决方案中。
- **框架组件**
- **依赖发现模型 (DDM)**:接收数据质量评估组件的结果,构建学习数据集,用于发现评估数据质量维度的依赖结构。
- **依赖发现算法 (DDA)**:通过贝叶斯网络 (BN) 实现,利用DDM存储的信息发现依赖结构。
##### 依赖结构发现
以意大利社会保障贡献者名单数据库为例,展示了如何使用BN模型进行数据质量维度依赖的推理和数据质量改进。
- **意
0
0
复制全文
相关推荐










