tensorflow-keras猫狗识别迁移学习源码案例+数据集+注释+离线模型资源-CSDN下载

共3个文件

zip：2个

py：1个

tensorflow

深度学习

迁移学习

猫狗识别

需积分: 18 139 浏览量 2022-07-29 10:27:34 上传评论 11 收藏 216.31MB ZIP 举报

在本项目中，我们主要探讨的是使用TensorFlow 2.3和Keras库构建一个卷积神经网络（CNN）进行猫狗图像识别的迁移学习应用。这个案例包含了完整的源码、训练所需的数据集、详尽的注释以及预训练的离线模型，使得初学者能够快速理解并实践深度学习中的迁移学习技术。我们要了解迁移学习的概念。迁移学习是一种机器学习方法，它利用已在一个任务上训练好的模型（通常是在大规模数据集上，如ImageNet）的知识来提升新任务的学习效率和性能。在这个猫狗识别项目中，我们将使用预训练的CNN模型作为基础，通过微调其权重来适应新的猫狗分类任务。 TensorFlow 2.3和Keras是实现这一目标的强大工具。TensorFlow是一个开源的深度学习框架，提供了丰富的API用于构建和训练神经网络模型。Keras则是一个高级的神经网络API，它以简洁易用的方式构建在TensorFlow之上，使得模型搭建更加直观。接下来，我们将关注CNN的运作原理。CNN是专门为处理图像数据而设计的神经网络结构，它包含卷积层、池化层、激活函数（如ReLU）、全连接层等组件。卷积层通过滤波器（或称核）提取图像特征，池化层则降低数据维度，减少计算量，而全连接层则将提取到的特征用于分类。在猫狗识别的数据集中，每张图片都标注为“猫”或“狗”。在训练过程中，模型会学习区分这两种动物的特征。数据预处理是关键步骤，包括图像的归一化、大小调整等，以确保输入到模型的图片具有统一格式。在源码中，我们首先加载预训练的模型（如VGG16、ResNet50等），然后冻结除最后一层之外的所有层，只训练顶部的几层或添加的新层。这样可以利用预训练模型的底层特征，同时避免过拟合。通过反向传播和优化算法（如Adam）更新权重，逐步优化模型性能。评估模型通常采用交叉验证和验证集，监控损失函数（如交叉熵）和准确率，调整超参数（如学习率、批次大小等）。最终，我们可以保存训练好的模型，以便离线使用或部署到实际应用中。在项目提供的离线模型中，已经包含了训练好的权重，可以直接用于对新的猫狗图片进行预测。只需加载模型并传入测试图片，模型就能输出该图片属于猫还是狗的概率。这个项目为学习者提供了一个完整的深度学习实践流程，涵盖了数据准备、模型构建、训练、评估和应用，是理解并掌握TensorFlow和Keras进行迁移学习的绝佳实例。通过深入研究这个案例，你可以更好地理解和运用深度学习技术解决实际问题。

资源详情

资源评论

资源推荐

收起资源包目录

dog_cat-迁移学习.zip （3个子文件）

dog_cat-迁移学习

dog_cat-keras-迁移学习.py 6KB

data.zip 65.45MB

下载好的离线模型.zip 151.14MB

import os import warnings warnings.filterwarnings("ignore") import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.keras.optimizers import Adam from tensorflow.keras.preprocessing.image import ImageDataGenerator from tensorflow.keras import layers from tensorflow.keras import Model from tensorflow.keras.callbacks import ModelCheckpoint, LearningRateScheduler from tensorflow.keras.callbacks import ReduceLROnPlateau #%% 加载预训练模型 from tensorflow.keras.applications.resnet import ResNet50 from tensorflow.keras.applications.resnet import ResNet101 from tensorflow.keras.applications.inception_v3 import InceptionV3 # ResNet101网络 # 默认输入图片大小为224*224*3，使用input_shape参数重新设置 # include_top：设置是否包含最后用于分类的全连接层 # weights：设置使用哪种数据集训练出来的参数 pre_trained_model = ResNet101(input_shape = (75, 75, 3), # 输入大小 include_top = False, # 不要最后的全连接层 weights = 'imagenet') #%% 构建网络 # 加载进来的自带训练好的参数的网络不需要再训练 for layer in pre_trained_model.layers: layer.trainable = False # 拉平为全连接层准备 x = layers.Flatten()(pre_trained_model.output) # 加入全连接层，这个需要重头训练的 x = layers.Dense(1024, activation='relu')(x) x = layers.Dropout(0.2)(x) # 输出层，二分类只需要一个神经元 x = layers.Dense(1, activation='sigmoid')(x) # 构建模型序列 model = Model(pre_trained_model.input, x) # 定义算法 model.compile(optimizer = Adam(lr=0.001), loss = 'binary_crossentropy', metrics = ['acc']) #%% 构建图片生成器 base_dir = './data/cats_and_dogs' train_dir = os.path.join(base_dir, 'train') validation_dir = os.path.join(base_dir, 'validation') train_cats_dir = os.path.join(train_dir, 'cats') train_dogs_dir = os.path.join(train_dir, 'dogs') validation_cats_dir = os.path.join(validation_dir, 'cats') validation_dogs_dir = os.path.join(validation_dir, 'dogs') train_datagen = ImageDataGenerator(rescale = 1./255., rotation_range = 40, width_shift_range = 0.2, height_shift_range = 0.2, shear_range = 0.2, zoom_range = 0.2, horizontal_flip = True) test_datagen = ImageDataGenerator( rescale = 1.0/255. ) # 以文件夹路径为参数，不断产生batch数据，是经过数据提升/归一化以后 # directory：目标文件夹，该文件夹下放置的是以标签为命名的子文件夹，有几个子文件夹就认为有几个类， # 子文件夹中任何jpg,png,bnp的图片都会被生成器使用 # batch_size：整数tuple,默认为(256,256),图像将被reisze成该尺寸 # color_mode:颜色模式，为'grayscale','rgb'之一，默认为'rgb' # classes:可选参数，为子文件夹列表如['dogs','cats'],默认为None,若未提供则自动推断 # class_mode:该参数决定了返回的标签数组的形式，默认"categorical":返回2D的one-hot标签， # "binary":返回1D的二值标签 train_generator = train_datagen.flow_from_directory(train_dir, batch_size = 20, class_mode = 'binary', target_size = (75, 75)) validation_generator = test_datagen.flow_from_directory( validation_dir, batch_size = 20, class_mode = 'binary', target_size = (75, 75)) #%% 构建回调 # Prepare model model saving directory. save_dir = os.path.join(os.getcwd(), 'saved_models') model_name = 'garbage_model.h5' if not os.path.isdir(save_dir): os.makedirs(save_dir) filepath = os.path.join(save_dir, model_name) def lr_schedule(epoch): lr = 1e-3 if epoch > 180: lr *= 0.5e-3 elif epoch > 160: lr *= 1e-3 elif epoch > 120: lr *= 1e-2 elif epoch > 80: lr *= 1e-1 print('Learning rate: ', lr) return lr class myCallback(tf.keras.callbacks.Callback): def on_epoch_end(self, epoch, logs={}): if(logs.get('acc')>0.95): print("\nReached 95% accuracy so cancelling training!") self.model.stop_training = True #该回调函数在每个epoch后保存模型到filepath checkpoint = ModelCheckpoint(filepath=filepath, monitor='val_acc', verbose=1, save_best_only=True) #学习率调度函数 #该函数以epoch号为参数（从0起的整数），返回一个新学习率（浮点数） lr_scheduler = LearningRateScheduler(lr_schedule) lr_reducer = ReduceLROnPlateau(factor=np.sqrt(0.1), cooldown=0, patience=5, min_lr=0.5e-6) callbacks = [checkpoint, lr_reducer, lr_scheduler, myCallback()] #%% 训练 history = model.fit_generator( train_generator, validation_data = validation_generator, steps_per_epoch = 100, epochs = 100, validation_steps = 50, verbose = 1, callbacks=callbacks) #%% 保存模型 save_dir = os.path.join(os.getcwd(), 'saved_models') if not os.path.isdir(save_dir): os.makedirs(save_dir) model_name = 'last_model.h5' filepath = os.path.join(save_dir, model_name) print('saveing model') model.save(filepath) print('save model finished!') #%% 绘图 import matplotlib.pyplot as plt acc = history.history['acc'] val_acc = history.history['val_acc'] loss = history.history['loss'] val_loss = history.history['val_loss'] epochs = range(len(acc)) plt.plot(epochs, acc, 'b', label='Training accuracy') plt.plot(epochs, val_acc, 'r', label='Validation accuracy') plt.title('Training and validation accuracy') plt.legend() plt.figure() plt.plot(epochs, loss, 'b', label='Training Loss') plt.plot(epochs, val_loss, 'r', label='Validation Loss') plt.title('Training and validation loss') plt.legend() plt.show()