生成对抗网络(GAN)技术解析
立即解锁
发布时间: 2025-08-31 00:05:18 阅读量: 5 订阅数: 11 AIGC 

### 生成对抗网络(GAN)技术解析
#### 1. 引言
生成对抗网络(GAN)是一种强大的深度学习模型,它通过生成器和判别器的对抗训练,能够将随机噪声转化为与训练集难以区分的数据。然而,原始的GAN存在训练信号不稳定等问题,后续出现了许多改进的GAN模型和训练技巧。
#### 2. CycleGAN与图像翻译
CycleGAN是用于图像翻译的模型,其核心思想是从一个方向(如照片到莫奈风格画作)进行转换,再转换回来应能恢复原始图像。CycleGAN的损失函数是三种损失的加权和:
- **内容损失**:基于ℓ1范数,鼓励转换前后的图像相似。
- **对抗损失**:使用判别器,使输出与目标领域的真实示例难以区分。
- **循环一致性损失**:鼓励映射可逆,通过同时训练两个模型,一个从第一领域映射到第二领域,另一个反向映射。如果转换后的图像能成功转换回原始领域的图像,循环一致性损失就低。
以下是CycleGAN的训练流程:
```mermaid
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A([开始]):::startend --> B(输入第一风格图像):::process
B --> C(通过第一个模型转换为第二风格图像):::process
C --> D(通过第二个模型转换回第一风格图像):::process
D --> E(计算循环一致性损失):::process
C --> F(计算对抗损失):::process
B --> G(计算内容损失):::process
E & F & G --> H(加权求和得到总损失):::process
H --> I(更新模型参数):::process
I --> J{是否达到训练次数}:::process
J -- 否 --> B
J -- 是 --> K([结束]):::startend
```
#### 3. StyleGAN的原理
StyleGAN是一种更现代的GAN,它将数据集中的变化划分为有意义的组件,每个组件由潜在变量的子集控制,能在不同尺度上控制输出图像,并将风格与噪声分离。
##### 3.1 主要生成分支
StyleGAN的主要生成分支从一个学习到的4×4、512通道的常量表示开始,通过一系列卷积层逐步上采样表示,以生成最终分辨率的图像。
##### 3.2 噪声注入
代表噪声的潜在变量是独立采样的高斯向量z1, z2...,在主生成管道的每个卷积操作后加法注入。它们与添加点的主表示具有相同的空间大小,但乘以学习到的每通道缩放因子ψ1, ψ2...,随着网络分辨率的增加,噪声在更精细的尺度上起作用。
##### 3.3 风格控制
代表风格的潜在变量从一个1×1×512的噪声张量开始,通过一个七层全连接网络创建中间变量w,使网络能够对风格方面进行去相关,w的每个维度可以代表一个独立的现实世界因素。变量w线性变换为一个2×1×512的张量y,用于设置主分支中表示在空间位置上的每通道均值和方差,这称为自适应实例归一化。
以下是StyleGAN的结构示意:
| 部分 | 描述 |
| ---- | ---- |
| 主要生成分支 | 从4×4、512通道的常量表示开始,通过卷积层上采样生成图像 |
| 噪声注入 | 独立采样的高斯向量,乘以缩放因子后加法注入 |
| 风格控制 | 噪声张量通过全连接网络得到w,再变换为y进行自适应实例归一化 |
#### 4. GAN的其他相关技术
##### 4.1 GAN损失函数
原始的GAN损失函数不稳定,后续出现了多种改进的损失函数:
- **最小二乘GAN**:隐式最小化皮尔逊χ2散度。
- **相对论GAN**:判别器估计真实数据示例比生成数据更真实的概率。
- **基于能量的GAN**:判别器是一个为真实数据赋予低能量、其他地方赋予高能量的函数。
- **Wasserstein GAN**:基于地球移动距离/最优传输,要求判别器的Lipschitz常数小于1。
##### 4.2 训练GAN的技巧
为提高GAN训练的稳定性和最终结果的质量,有许多启发式技巧:
- **截断技巧**:权衡GAN输出的可变性和质量。
- **仅使用最真实的K张图像的梯度**。
- **判别器中的标签平滑**。
- **使用生成图像的历史记录更新判别器**。
- **向判别器输入添加噪声**。
##### 4.3 样本多样性与模式崩溃
原始的GAN理论认为在足够的容量、训练样本和计算时间下,能最小化生成样本与真实分布之间的Jensen - Shannon散度,但实际情况并非总是如此。缺乏多样性的极端情况是模式
0
0
复制全文
相关推荐










