径向基神经网络输入空间的密度网格聚类划分与城市空气质量预测
立即解锁
发布时间: 2025-08-20 01:07:36 阅读量: 1 订阅数: 7 


智能技术与计算智能前沿进展
# 径向基神经网络输入空间的密度网格聚类划分与城市空气质量预测
## 一、径向基神经网络隐藏节点选择
在对输入空间进行网格划分和组合后,输入空间会被划分为 $S'$ 个子空间,其中 $S' = \prod_{i = 1}^{N} d_{i}$。接下来要选择能均匀覆盖输入数据分布的合适子空间,并将这些子空间的中心作为径向基(RBF)神经网络的隐藏节点。
为了选出合适的子空间,引入了多维隶属函数:
\[
\mu_{A_{l}}(x(k)) =
\begin{cases}
1 - rd_{l}(x(k)), & rd_{l}(x(k)) \leq 1 \\
0, & \text{otherwise}
\end{cases}
\]
其中,$rd_{l}(x(k))$ 是子空间 $A_{l}$ 与输入向量 $x(k)$ 的欧几里得相对距离。
选择隐藏节点中心的步骤如下:
1. 初始化聚类数 $L = 1$ 和训练数据 $x(k)$($k = 1$)。计算输入向量 $x(1)$ 在每个子空间中的隶属度,选择隶属度最大的子空间作为第一个聚类中心 $A_{l}$($l = 1$),然后令 $k = 2$。
2. 分别计算 $x(k)$ 与已生成的每个聚类中心的欧几里得相对距离 $rd_{l}(x(k))$。
3. 记 $\min(rd_{l}(x(k)))$ 为 $rd_{l}(x(k))$ 的最小值。若 $rd_{l}(x(k)) \leq 1$,说明存在一个聚类覆盖 $x(k)$,则令 $k = k + 1$,并计算 $rd_{l}(x(k)) = \frac{1}{N\delta} \sum_{i = 1}^{N} (x_{i}(k) - a_{i,l})^{2}$,然后回到步骤 2;否则,说明没有聚类覆盖 $x(k)$,需要生成一个新的聚类,令 $L = L + 1$。
4. 计算 $x(k)$ 在每个子空间中的隶属度,选择隶属度最大的子空间作为第 $L$ 个聚类中心 $A_{l}$。令 $k = k + 1$,回到步骤 2,直到完成所有训练数据的计算。
经过上述步骤,会生成 $L$ 个聚类。对于任意的 $x(k)$,都存在一个聚类中心,其与 $x(k)$ 的欧几里得相对距离不超过 1。因此,这些聚类中心可以作为 RBF 神经网络的隐藏节点中心。隐藏节点的宽度可以通过 $P$ - 最近邻启发式方法计算,本文中 $P$ 的值约为隐藏节点数量的 50%。
## 二、示例与仿真
以化工工程中的非等温连续搅拌釜式反应器(CSTR)为例,该过程由以下方程描述:
\[
\begin{cases}
\frac{dC_{A}}{dt} = \frac{F}{V} (C_{A,in} - C_{A}) - k_{0} C_{A}^{2} \exp(-\frac{E}{RT}) \\
\frac{dT}{dt} = \frac{F}{V} (T_{in} - T) + \frac{UA}{V\rho c_{P}} (T_{j} - T) - \frac{(-\Delta H_{R}) k_{0} C_{A}^{2}}{V\rho c_{P}} \exp(-\frac{E}{RT})
\end{cases}
\]
系统中的参数值如下表所示:
| 参数 | $V$ | $UA$ | $\rho$ | $c_{P}$ | $(-\Delta H_{R})$ | $k_{0}$ | $E$ | $R$ |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| 值 | 100 | 20000 | 1000 | 4.2 | 596619 | $6.85×10^{11}$ | 76534.704 | 8.314 |
| 单位 | L | J/s·K | g/L | J/g·K | J/mol | L/s·K | J/mol | J/mol·K |
在 Matlab 中使用 Simulink 构建反应器模型,在输入变量的稳态值上添加干扰,假设干扰范围为输入变量的 5%。输入变量的稳态值如下表所示:
| 变量 | $F$ | $C_{A,in}$ | $T_{in}$ | $T_{j}$ |
| ---- | ---- | ---- | ---- | ---- |
| 值 | 20 L/s | 275 K | 250 K | 1 mol/L |
采样周期 $T_{s} = 1$,从系统方程中计算 2000 个输出数据,前 1000 个样本用于训练神经网络,后 1000 个数据用于测试神经网络的准确性。测试数据的平方误差和(SSE)可以通过 $SSE = \sum_{i = 1}^{N} (y_{i} - \hat{y}_{i})^{2}$ 计算,其中 $y_{i}$ 是系统的真实数据值,$\hat{y}_{i}$ 是神经网络的估计值。
分别使用均匀划分方法和本文提出的网格聚类划分方法训练 RBF 神经网络,结果如下表所示:
| 均匀划分结果 | | | | |
| ---- | ---- | ---- | ---- | ---- |
| $C$ | $L$ | $SSE_{1}$ | $SSE_{2}$ | $T$ |
| 4 | 12 | 0.018 | 26349 | 0.55 |
| 5 | 285 | 0.026 | 3710 | 6.95 |
| 6 | 898 | 0.014 | 9508 | 67.52 |
| 7 | 999 | 0.015 | 8988 | 76.48 |
| 8 | 1000 | 0.013 | 10028 | 75.04 |
| 密度划分结果 | | | | |
| ---- | ---- | ---- | ---- | ---- |
| $id$ | $K/m$ | $L$ | $SSE_{1}$ | $SSE_{2}$ | $T$ |
| 12 | 142 | 72 | 0.010 | 21579 | 3.38 |
| 19 | 167 | 177 | 0.009 | 9514 | 11.08 |
| 37 | 200 | 214 | 0.020 | 2943 | 10.01 |
| 17 | 143 | 185 | 0.007 | 7351 | 7.52 |
| 17 | 167 | 165 | 0.003 | 7802 | 7.52 |
从表中可以看出,神经网络的准确性和训练时间会随着划分集的数量和隐藏节点的数量而变化。通过适当选择初始划分集和子区间内数据数量的上限,可以创建具有较高准确性和较短训练时间的 RBF 神经网络。通常情况下,准确性越高,训练时间越长,因此在训练神经网络时需要在模型准确性和训练时间之间进行权衡。
mermaid 流程图如下:
```mermaid
graph TD;
A[初始化聚类数L=1和训练数据x(k)] --> B[计算x(1)隶属度选第一个聚类中心];
B --> C[计算x(k)与聚类中心距离];
C --> D{距离是否<=1};
D -- 是 --> E[更新k和距离,回C];
D -- 否 --> F[生成新聚类];
F --> G[计算x(k)隶属度选新聚类中心];
G --> H[更新k,回C];
H --> I{是否完成所有训练数据计算};
I -- 否 --> C;
I -- 是 --> J[完成聚类];
```
## 三、城市空气质量预测模型
### 3.1 研究背景
城市空气质量是制约城市发展的重要因素,受城市地理、气象、污染分布等多种因素影响,其随时间的变化呈现典型的非线性特征。人工神经网络具有强大的学习
0
0
复制全文
相关推荐










