keras的ImageDataGenerator和flow()的用法说明资源-CSDN下载

136 浏览量 2020-09-16 13:42:56 上传评论 1 收藏 59KB PDF 举报

在深度学习领域，Keras库提供了许多方便的数据预处理工具，其中之一便是`ImageDataGenerator`。这个类主要用于在训练过程中对图像数据进行实时增强，以增加模型的泛化能力。`flow()`函数是`ImageDataGenerator`的一个重要方法，用于从numpy数组或者数据目录中生成批次的增强图像。 `ImageDataGenerator`的参数非常多，主要可以分为以下几类： 1. **标准化与归一化**： - `featurewise_center`: 是否对每个特征通道进行均值中心化。 - `samplewise_center`: 是否对每个样本进行均值中心化。 - `featurewise_std_normalization`: 是否对每个特征通道进行标准差归一化。 - `samplewise_std_normalization`: 是否对每个样本进行标准差归一化。 - `zca_whitening`: 是否应用ZCA白化。 - `zca_epsilon`: ZCA白化时的微小值防止除以零。 2. **几何变换**： - `rotation_range`: 随机旋转的角度范围。 - `width_shift_range`: 图像宽度上的随机平移比例。 - `height_shift_range`: 图像高度上的随机平移比例。 - `shear_range`: 剪切变换的角度范围。 - `zoom_range`: 随机缩放的比例范围。 - `horizontal_flip`: 是否随机水平翻转。 - `vertical_flip`: 是否随机垂直翻转。 3. **其他参数**： - `rescale`: 图像数据的重新缩放因子。 - `preprocessing_function`: 自定义的预处理函数。 - `data_format`: 数据格式，'channels_first'或'channels_last'，决定颜色通道的位置。使用`flow()`函数时，可以传入numpy数组来直接处理数据，如`X_train`和`Y_train`。`batch_size`参数决定了每次生成的批次大小。当`batch_size`小于`X_train`的第一维（样本数）时，它会随机抽取`batch_size`个样本；如果`batch_size`大于样本数，所有样本都会被随机排序并分成多个批次。在示例代码中，创建了一个`ImageDataGenerator`实例，并设置了各种增强参数，然后通过`flow()`函数生成了一个迭代器`a`。通过`next(a)`，我们可以获取到增强后的图像批次及其对应的标签。需要注意的是，当混合使用TensorFlow和Keras时，可能会遇到一些兼容性问题。在保存和加载模型时，需要确保使用相同版本的库，并正确处理模型的保存格式。在上述例子中，作者提到了在使用`model.load_model()`时遇到的错误，这通常是因为模型的结构或保存格式不匹配导致的。在不同版本的库之间切换时，需要特别留意这类问题。在使用`ImageDataGenerator`时，确保理解其参数的含义和作用，以及如何正确使用`flow()`方法，这对于训练深度学习模型特别是图像分类模型来说至关重要。同时，保持库的更新和注意版本兼容性也是避免遇到问题的关键。

资源推荐

资源详情

资源评论

keras的的ImageDataGenerator和和flow()的用法说明的用法说明

主要介绍了keras的ImageDataGenerator和flow()的用法说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

ImageDataGenerator的参数自己看文档的参数自己看文档

from keras.preprocessing import image

import numpy as np

X_train=np.ones((3,123,123,1))

Y_train=np.array([[1],[2],[2]])

generator=image.ImageDataGenerator(featurewise_center=False,

samplewise_center=False,

featurewise_std_normalization=False,

samplewise_std_normalization=False,

zca_whitening=False,

zca_epsilon=1e-6,

rotation_range=180,

width_shift_range=0.2,

height_shift_range=0.2,

shear_range=0,

zoom_range=0.001,

channel_shift_range=0,

fill_mode='nearest',

cval=0.,

horizontal_flip=True,

vertical_flip=True,

rescale=None,

preprocessing_function=None,

data_format='channels_last')

a=generator.flow(X_train,Y_train,batch_size=20)#生成的是一个迭代器，可直接用于for循环

'''

batch_size如果小于X的第一维m，next生成的多维矩阵的第一维是为batch_size，输出是从输入中随机选取batch_size个数据

batch_size如果大于X的第一维m，next生成的多维矩阵的第一维是m，输出是m个数据，不过顺序随机

，输出的X，Y是一一对对应的

如果要直接用于tf.placeholder()，要求生成的矩阵和要与tf.placeholder相匹配

'''

X,Y=next(a)

print(Y)

X,Y=next(a)

print(Y)

X,Y=next(a)

print(Y)

X,Y=next(a)

输出

[[2]

[1]

[2]]

[[2]

[2]

[1]]

[[2]

[2]

[1]]

[[2]

[2]

[1]]

补充知识：补充知识：tensorflow 与与keras 混用之坑混用之坑

在使用tensorflow与keras混用是model.save 是正常的但是在load_model的时候报错了在这里mark 一下

其中错误为：TypeError: tuple indices must be integers, not list

再一一番百度后无结果，上谷歌后找到了类似的问题。但是是一对鸟文不知道什么东西（翻译后发现是俄文）。后来谷歌翻译了一下找到了解决方法。故将原始问题文章贴上来警示一下

原训练代码

from tensorflow.python.keras.preprocessing.image import ImageDataGenerator

from tensorflow.python.keras.models import Sequential

from tensorflow.python.keras.layers import Conv2D, MaxPooling2D, BatchNormalization

from tensorflow.python.keras.layers import Activation, Dropout, Flatten, Dense

#Каталог с данными для обучения

train_dir = 'train'

# Каталог с данными для проверки

val_dir = 'val'

# Каталог с данными для тестирования

test_dir = 'val'

# Размеры изображения

img_width, img_height = 800, 800

# Размерность тензора на основе изображения для входных данных в нейронную сеть

# backend Tensorflow, channels_last

input_shape = (img_width, img_height, 3)

# Количество эпох

epochs = 1

# Размер мини-выборки

batch_size = 4

# Количество изображений для обучения

nb_train_samples = 300

# Количество изображений для проверки

nb_validation_samples = 25

# Количество изображений для тестирования

nb_test_samples = 25

model = Sequential()

model.add(Conv2D(32, (7, 7), padding="same", input_shape=input_shape))

model.add(BatchNormalization())

model.add(Activation('tanh'))

model.add(MaxPooling2D(pool_size=(10, 10)))

model.add(Conv2D(64, (5, 5), padding="same"))

model.add(BatchNormalization())

model.add(Activation('tanh'))

model.add(MaxPooling2D(pool_size=(10, 10)))

model.add(Flatten())

model.add(Dense(512))

model.add(Activation('relu'))

model.add(Dropout(0.5))

model.add(Dense(10, activation='softmax'))

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

weixin_38582506

粉丝: 4

keras的ImageDataGenerator和flow()的用法说明

Keras中 ImageDataGenerator函数的参数用法

使用Keras 的ImageDataGenerator类实现批量数据增强

使用Keras中的ImageDataGenerator进行批次读图方式

Keras 数据增强ImageDataGenerator多输入多输出实例

matlab开发-Image2Data

Binary-Image-classification:在Keras中使用ImageDataGenerator对二进制图像进行分类

关于keras中keras.layers.merge的用法说明

Keras和VGG16模型-迁移学习

keras-data-augmentation.zip

完美解决TensorFlow和Keras大数据量内存溢出的问题

tensorflow ImageDataGenerator图像数据生成

基于Keras+Unet实现医学图像分割源码+数据集+项目说明.zip

Python-使用Keras实现GoogleMobileNet

基于Python keras 图像识别【100011845】

基于keras 图像识别源码+数据.zip

浅谈keras2 predict和fit_generator的坑

keras 读取多标签图像数据方式

Python-ImplementationonEfficientNetmodelKeras

Keras 在fit_generator训练方式中加入图像random_crop操作

python CNN卷积神经网络数据+清晰的代码说明适合新手

使用Keras构造简单的CNN网络实例

data_pipeline_python_数据集扩充_

augmentation_schemes:在Tensorflow 2 Keras中实施的增强方案

Training Data Insufficient(处理方案).md

基于python的猫狗识别的卷积神经网络案例

TensorFlow笔记41

Qt 5实现串口调试助手 （源工程文件、0积分下载）

AutoSAR标准协议4.2.2

百度地图 添加热区（Hotspot）

网文管理系统.zip

最新资源

Qt 5实现串口调试助手（源工程文件、0积分下载）

百度地图添加热区（Hotspot）