资源调度协议挖掘:方法、评估与优化
立即解锁
发布时间: 2025-08-20 01:49:55 阅读量: 2 订阅数: 5 


业务流程管理:第12届国际会议论文集
### 资源调度协议挖掘:方法、评估与优化
在服务流程中,资源调度是一个至关重要的问题,它直接影响着服务的质量和效率。本文将深入探讨资源调度协议的挖掘方法,包括数据挖掘分类器和排队启发式算法,并通过大规模的实际数据集进行评估,最后讨论相关的优化和改进方向。
#### 资源调度与排队信息
资源调度,特别是在服务流程中,与资源的技能以及系统负载密切相关。系统负载可以通过队列长度或最延迟客户的等待时间(即队首等待时间,HOL)来衡量。基于这些见解,解决资源调度问题的技术考虑了四个层次的排队信息:
1. 无排队信息
2. 客户队列的长度
3. 客户队列中HOL的等待时间
4. 前两个层次的组合
#### 从服务日志中挖掘排队信息
为了挖掘与排队信息相关的分配决策,我们从客户服务日志中提取队列长度和最长等待时间的信息。具体步骤如下:
1. **估计队列长度**:给定客户服务日志 $(S, G, \{\tau, \eta, \epsilon\})$ 和时间 $t$,队列长度 $q_{di}(t)$ 可以通过以下公式估计:
\[ \hat{q}_{di}(t) = |\{(g_1, \ldots, g_m) \in G | \epsilon(g_m) = qEntry \land \tau(g_m) \leq t \land \eta(g_m) = d_i\}| \]
2. **估计HOL等待时间**:同样,对于每个队列中最长等待客户的向量 $h(t) = (h_{d_1}(t), \ldots, h_{d_n}(t))$,可以通过以下公式估计:
\[ \hat{h}_{d_i}(t) = \min_{s \in \{s \in S | \epsilon(s) = qEntry \land \eta(s) = d_i \land \exists (g_1, \ldots, s) \in G\}} t - \tau(s) \]
3. **挖掘资源分配决策**:从资源服务日志 $(S, G, \{\tau, \eta, \sigma, \varphi, \delta\})$ 中,通过识别资源状态切换到“Serving”的时间戳来挖掘分配决策。分配决策的集合为:
\[ V = \{s \in S | \varphi(s) = Serving \land \delta(s) = Start\} \]
4. **导出解释特征向量**:最后,为分配决策集合导出一组解释特征向量 $X$:
\[ X = \{x = (s, \sigma(s), q_{d_1}(t), \ldots, q_{d_n}(t), h_{d_1}(t), \ldots, h_{d_n}(t)) | s \in V \land t = \tau(s)\} \]
这些特征向量对应于分配资源的技能组以及分配时的排队信息(队列长度和HOL等待时间)。
#### 数据挖掘分类器
我们考虑四种适合将资源调度问题作为分类问题解决的数据挖掘技术:线性判别分析(LDA)、多项逻辑回归(MLR)、决策树和随机森林。
- **线性分类器**
- **LDA**:LDA方法构建一个判别函数 $\delta_d(x)$,根据特征向量 $x$ 选择最可能的决策。后验概率 $P(D = d|X = x)$ 可以根据贝叶斯定理重写:
\[ P(D = d|X = x) = \frac{f_d(x) \cdot P(D = d)}{\sum_{l \in D} f_l(x) \cdot P(D = l)} \]
其中 $f_d(x) = P(X = x|D = d)$ 是决策 $d$ 的先验概率。LDA假设 $f_d(x)$ 来自高斯分布,并且所有类 $d \in D$ 具有共同的协方差矩阵。因此,判别函数 $\delta_d(x)$ 是关于 $x$ 的线性函数。
- **MLR**:MLR方法试图通过关于 $x$ 的线性函数对后验概率 $P(D = d|X = x)$ 进行逻辑变换。与LDA不同,MLR确保这些函数的和为1,并且取值范围在 $[0, 1]$ 之间。一般来说,MLR需要更多的数据观测来保证准确性,而LDA对异常值的鲁棒性较差。
- **基于树的分类器**
- **决策树**:分类(决策)树试图在特征空间 $(R^p)$ 中找到 $m$ 个区域 $R_1, \ldots, R_m$,以最好地解释观察到的结果。决策树具有低偏差,但方差较大。
- **随机森林**:为了处理决策树的大方差问题,引入了随机森林算法。该算法通过生长多个不相关的决策树(森林)并对结果进行平均,从而降低方差。
- **使用决策树示例挖掘协议**
为了演示数据挖掘方法在资源调度协议发现中的应用和相关性,我们使用来自以色列一家电信公司的实际数据进行说明。该公司的服务流程遵循W架构,有三种类型的客户:低优先级、普通和VIP。
通过决策树得到的调度协议如下:
1. 如果没有可用信息,最佳预测是Q2,因为这与最常见的客户类型分配相关。
2. 如果代理技能为1(普通代理),最佳预测是Q1,因为分配到该组的大多数客户来自低优先级客户队列。如果技能指向高级代理,最佳预测是Q2。
3. 决策树的第二层考虑了排队信息。对于普通代理,预测基于是否有等待的普通客户(Q2),如果没有,则基于HOL等待时间。对于高级代理,他们被分配给等待6秒或更长时间的VIP客户。
这个例子说明了该方法如何从基于资源特征和排队信息的事件数据中学习调度协议。
#### 排队启发式算法
除了数据挖掘技术,我们还考虑了基于排队启发式算法的调度决策预测方法。这里介绍两种启发式算法:
- **最长队列优先(LQF)**:该启发式算法基于分配决策时刻的队列长度。给定时间 $t$、资源的可行分配决策集合 $F \subseteq D$ 以及观察到的队列长度向量 $q(t) = (q_{d_1}(t), \ldots, q_{d_n}(t))$,预测的分配决策定义为:
\[ d = \arg \max_{f \in F} q_f(t) \]
如果有多个队列长度相同(包括所有组件 $q(t) = 0$ 的情况),则优先选择先验概率更可能的队列。
- **最延迟优先(MDF)**:该启发式算法预测将资源分配给HOL等待时间最长的队列。给定时间 $t$ 和HOL向量 $h(t)$
0
0
复制全文
相关推荐










