知识图谱实体对齐与对象中心性能分析研究
立即解锁
发布时间: 2025-08-20 02:17:39 阅读量: 1 订阅数: 5 


概念建模与本体驱动模型目录
### 知识图谱实体对齐与对象中心性能分析研究
#### 1. 对象中心性能分析
在对象中心性能分析中,有多种性能指标的计算方法:
- **逗留时间(sojourn)**:对于任意事件发生 $eo = (t, e) \in O$,$sojourn(eo, V ) = \pi_{ct}(e) - \max(T)$,其中 $T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$。
- **等待时间(wait)**:对于任意事件发生 $eo = (t, e) \in O$,$wait(eo, V ) = \pi_{st}(e) - \max(T)$,其中 $T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$。
- **服务时间(service)**:对于任意事件发生 $eo = (t, e) \in O$,$service(eo, V ) = \pi_{ct}(e) - \pi_{st}(e)$。
- **同步时间(sync)**:对于任意事件发生 $eo = (t, e) \in O$,$sync(eo, V ) = \max(T) - \min(T)$,其中 $T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$。
- **池化时间(poolot)**:对于任意事件发生 $eo = (t, e) \in O$,$poolot(eo, V ) = \max(T) - \min(T)$,其中 $T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \land type(\pi_{oi}(tv)) = ot \}$。
- **滞后时间(lagot)**:对于任意事件发生 $eo = (t, e) \in O$,$lagot(eo, V ) = \max(T') - \min(T)$,其中 $T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$ 且 $T' = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \land type(\pi_{oi}(tv)) \neq ot \}$,若 $\max(T') > \min(T)$;否则为 0。
以下是这些指标的总结表格:
| 指标 | 计算公式 |
| ---- | ---- |
| 逗留时间(sojourn) | $sojourn(eo, V ) = \pi_{ct}(e) - \max(T)$,$T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$ |
| 等待时间(wait) | $wait(eo, V ) = \pi_{st}(e) - \max(T)$,$T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$ |
| 服务时间(service) | $service(eo, V ) = \pi_{ct}(e) - \pi_{st}(e)$ |
| 同步时间(sync) | $sync(eo, V ) = \max(T) - \min(T)$,$T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$ |
| 池化时间(poolot) | $poolot(eo, V ) = \max(T) - \min(T)$,$T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \land type(\pi_{oi}(tv)) = ot \}$ |
| 滞后时间(lagot) | $lagot(eo, V ) = \max(T') - \min(T)$,$T = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \}$,$T' = \{ \pi_{bt}(tv) | tv \in relON (eo, V ) \land type(\pi_{oi}(tv)) \neq ot \}$(若 $\max(T') > \min(T)$,否则为 0) |
为了验证这些指标的实用性,进行了一个实际案例研究,以荷兰金融机构的贷款申请流程为例。该流程中有两种对象类型:申请和报价。申请可以有一个或多个报价。具体流程如下:
1. 客户通过访问银行或使用在线系统创建申请。若通过访问银行创建申请,则跳过提交活动。
2. 申请完成并被接受后,银行通过向客户发送报价并打电话的方式向客户提供贷款。
3. 报价要么被接受,要么被取消。
在案例研究中,聚焦于因各种原因被取消的报价。通过选择十种最频繁的流程执行类型来过滤不常见的行为,并去除冗余活动,如“完成申请”后的状态更新“已完成”。最终的事件日志包含 1682 个申请和 3573 个报价的 20478 个事件。
将该方法与基于对齐的传统性能分析技术进行比较。应用传统技术时,首先使用申请和报价作为案例概念来扁平化日志。结果发现,传统技术存在一些不准确的情况,例如:
- 传统技术显示 1799 个申请重复执行“发送”活动,但实际上除了 92 个报价跳过该活动外,每个报价只执行一次该活动。并且该活动的平均逗留时间,传统技术计算约为 2 天 23 小时,而实际约为 15 分钟。
- 传统技术显示“取消申请”活动重复 1891 次,但实际上每个申请只执行 1682 次。该活动的平均逗留时间,传统技术测量约为 12
0
0
复制全文
相关推荐










