DataWhale 零基础入门语义分割-地表建筑物识别-Task2_零基础语义分割地表建筑识别代码-CSDN博客

本文是DataWhale零基础入门语义分割系列的第二部分，主要讲解数据扩增在地表建筑物识别任务中的应用。内容涵盖数据扩增的重要性，使用OpenCV进行图像翻转和裁剪，利用albumentations库进行复杂的数据增强，以及PyTorch数据集的定义和实例化。

DataWhale 零基础入门语义分割-地表建筑物识别-Task2

对语义分割任务中常见的数据扩增方法进行介绍，并使用OpenCV 和albumentations 两个库完成具体的数据扩增操作。
主要内容为数据扩增方法、OpenCV 数据扩增、albumentations 数据扩增和Pytorch 读取赛题数据四个部分组成。

数据扩增是一种有效的正则化方法，可以防止模型过拟合，在深度学习模型的训练过程中应用广泛。
数据扩增的目的是增加数据集中样本的数据量，同时也可以有效增加样本的语义空间。
需注意：

对于图像分类，数据扩增方法可以分为两类：

代码如下：

img = cv2.imread(train_mask[’name’].iloc[0])
mask = rle_decode(train_mask[’mask’].iloc[0])

代码如下：

'''
filename 是文件名称；filecode是进行的操作
filecode = 1 水平翻转
filecode = 0 垂直翻转
filecode = -1 水平垂直翻转
'''
cv2.flip(filename, filecode)

代码如下(以256*256为例)：

x, y = np.random.randint(0, 256), np.random.