递归自增强强化学习(RSE-RL)图像去噪实验解析
立即解锁
发布时间: 2025-08-31 00:25:06 阅读量: 10 订阅数: 32 AIGC 

### 递归自增强强化学习(RSE - RL)图像去噪实验解析
#### 1. 实验概述
本次实验主要验证 RSE - RL 算法在两个数据集上的性能,分别是合成噪声名人面部属性数据集(CelebA)和智能手机图像去噪数据集(SIDD)。实验目的是去除图像中的伪影,并期望该架构能优于其他去噪模型,以普通变分自编码器(VAE)作为基线模型。
#### 2. CelebA 合成伪影去噪实验
##### 2.1 数据集构建
- 从 CelebA_HQ/256 数据集中收集图像,图像大小为 256 × 256 像素。
- 使用 OpenCV 为每个图像添加均匀高斯噪声,形成与原始干净图像对应的合成噪声图像,将干净图像和噪声图像作为图像对。
- 将图像对分为训练集和验证集,训练集包含 2250 对图像,验证集包含 11250 对图像。
- 将每个图像分割成 16 × 16 像素的补丁,补丁之间有 4 像素的重叠,然后将这些补丁输入网络。
##### 2.2 实验设置
- **编码器**:使用 5 个卷积层和 2 个全连接层将基于补丁的图像投影到潜在空间。
- **解码器**:结构与编码器相反,有 2 个上采样层和 5 个转置卷积层。
- **实现框架**:使用 Keras 和 TensorFlow 实现网络,使用单个 12GB NVIDIA Tesla K80 GPU 进行训练和测试。
- **训练参数**:训练批量大小设置为 128,训练轮数为 50,正则化系数 λreg = 0.01,优化器选择 Adam,β1 = 0.9,β2 = 0.999。学习率由指数衰减学习率调度器设置,初始率为 0.001,衰减因子为 0.95,衰减步长为 1000。
- **自增强权重微调**:使用 OpenAI 的 Stable - Baseline3 实现 SAC 算法,使用 OpenAI Gym 设置环境。奖励计算根据特定公式,b = 1.25,c = 5,PSNRt = 30.0。终止条件为实际 PSNR 达到目标 PSNRt 或轮数达到最大允许步数(40)。动作空间是范围在 (0.999, 1.001) 内的权重向量集合。
##### 2.3 去噪结果
| 方法 | PSNR | SSIM | UQI |
| ---- | ---- | ---- | ---- |
| 含伪影图像 | 16.64 | 0.5835 | 0.7327 |
| N2V | 21.66 | 0.7242 | 0.9249 |
| N2N | 26.60 | / | / |
| VAE | 26.81 | 0.7621 | 0.9604 |
| RSE - RL(before) | 28.83 | 0.8322 | 0.9721 |
| RSE - RL | 29.03 | 0.8339 | 0.9731 |
| RSE - RL(S) | 28.79 | 0.8317 | 0.9717 |
从结果可以看出,RSE - RL 在各项质量指标上都有显著提升,且训练数据大小对其去噪性能影响不大。例如,使用 450 个训练图像(0.2 百万补丁)的 RSE - RL(S) 与 RSE - RL(before) 性能相近,这为减少训练时间提供了有效途径。
```merma
```
0
0
复制全文
相关推荐










