基于keras的数据增广(data augmentation)

最新推荐文章于 2023-02-15 01:00:23 发布

原创

最新推荐文章于 2023-02-15 01:00:23 发布 · 3k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#data augmentation #keras #数据增广 #tensorflow

当深度学习中遇到数据不足的问题时，数据增广是防止过拟合的有效手段。本文以图像为例，介绍了如何利用Keras库进行数据扩充，包括水平翻转、扭曲、变形等操作。通过修改现有的代码，可以对整个文件夹的图像进行批量数据增广，从而提高模型的泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在实际的深度学习当中,我们通常会遇到收集的数据过少,收集数据过于困难等,导致训练过程中很容易发生过拟合等现象.这时候我们就需要对数据进行扩充来避免这种现象.

下面就以图片来做例子,最简单的对图片进行扩充的方法是翻转,包括水平翻转和垂直翻转,但一般图像用到最多的是水平翻转,(正常物体不可能跑到天上去).还有对图像进行扭曲,变形,拉伸,填充,改变hsv或者rgb的值等等.

keras数据库提供了很好的解决途径.

#图片生成器ImageDataGenerator
keras.preprocessing.image.ImageDataGenerator(featurewise_center=False,
    samplewise_center=False,
    featurewise_std_normalization=False,
    samplewise_std_normalization=False,
    zca_whitening=False,
    zca_epsilon=1e-6,
    rotation_range=0.,
    width_shift_range=0.,
    height_shift_range=0.,
    shear_range=0.,
    zoom_range=0.,
    channel_shift_range=0.,
    fill_mode='nearest',
    cval=0.,
    horizontal_flip=False,
    vertical_flip=False,
    rescale=None,
    preprocessing_function=None,
    data_format=K.image_data_format())
#用以生成一个batch的图像数据，支持实时数据提升。训练时该函数会无限生成数据，直到达到规定的epoch次数为止。
'''参数
feat