基于pytorch实现的visiontransformer模型，针对水稻病虫害数据集进行训练，也可以用于其他多分类数据集资源-CSDN下载

共47个文件

jpg：13个

txt：12个

py：7个

版权申诉

5星 · 超过95%的资源 25 浏览量 2024-09-06 20:49:14 上传评论收藏 2.32MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于pytorch实现的vision transformer模型，针对水稻病虫害数据集进行训练，也可以用于其他多分类数据集.zip （47个子文件）

content

utils.py 941B

predict.py 5KB

dataset.py 7KB

nets

vit.py 23KB

model

vit_base_16_mlp768_head8

config.yaml 586B

logs

loss_and_acc_2024_04_25_15_55_57

epoch_accuracy.pdf 15KB

epoch_acc.txt 2KB

events.out.tfevents.1714031757.LAPTOP-9BSBTBER.19024.0 17KB

epoch_loss.txt 2KB

epoch_loss.pdf 14KB

epoch_val_loss.txt 2KB

epoch_val_acc.txt 1KB

vit_base_16

config.yaml 589B

logs

loss_and_acc_2024_04_29_13_49_37

epoch_accuracy.pdf 14KB

epoch_acc.txt 934B

events.out.tfevents.1714369777.R1S1-school.3846587.0 9KB

epoch_loss.txt 948B

epoch_loss.pdf 12KB

epoch_val_loss.txt 934B

epoch_val_acc.txt 550B

vit_base_16_pytorch

config.yaml 621B

logs

loss_and_acc_2024_04_29_13_59_56

epoch_accuracy.pdf 14KB

epoch_acc.txt 944B

epoch_loss.txt 952B

epoch_loss.pdf 12KB

events.out.tfevents.1714370396.R1S1-school.3847745.0 9KB

epoch_val_loss.txt 941B

epoch_val_acc.txt 570B

.gitignore 487B

callbacks.py 4KB

train.py 11KB

test.py 7KB

rice_data

bacterial blight

0000.jpg 81KB

brown spot

0940.jpg 89KB

label2name.json 276B

bacterial streak disease

0275.jpg 128KB

sheath blight

1968.jpg 33KB

rice smut

1729.jpg 107KB

other crops

1.jpg 707KB

health

4ACA69370C0CF695.jpg 389KB

rice blast

1454.jpg 93KB

thrip

0162.jpg 84KB

three chemical borers

0792.jpg 45KB

bad seeding

0651.jpg 127KB

planthopper

1203.jpg 38KB

no a crop

1.jpg 363KB

Readme.md 6KB

# Vision Transformer从零重构-基于Pytorch-水稻病虫害数据集预训练作者: 范昊 author: Hao Fan 本仓库仅供学习交流使用，实现参考 [Vision Transformer](https://arxiv.org/abs/2010.11929) 和 [Pytorch](https://github.com/pytorch/vision) 。 ## 简介 - `模型`: 本仓库从MultiHeadAttention开始一步步重构了Vit，相比官方实现更加通俗易懂，并且补充了大量注释； - `数据集`: 自定义的水稻病虫害多分类数据集，也可以很轻松地替换为自己的多分类数据集，仅需将每个类别的图片放入同一个文件夹，然后将所有类别的文件夹放入rice_data（可根据自己的数据集名称进行修改）即可； - `模型训练和模型保存逻辑`: 本仓库实现了基础的模型训练、日志和模型权重保存逻辑； --- <u> 项目结构介绍 </u> - `utils.py`: 一些工具函数等，当前包含一个设置日志器的函数； - `callbacks.py`: 用于记录训练日志的类定义； - `dataset.py`: 数据集加载定义，内部定义了DataSet类，只需传入多分类数据集文件路径和数据划分即可使用（具体类名可按自己需求进行更改）； - `train.py`: 训练脚本，仅需修改配置文件路径即可运行并开始训练模型； - `test.py`: 测试脚本，测试模型在测试集上性能； - `predict.py`: 预测脚本，可以选择单张图像进行预测； - `📁 nets`: 存放模型网络结构: - `vit.py`: 本仓库实现的Vision Transformer，从ScaledProduct到MultiHeadAttention再到Encoder一步步重构； - `📁 model`: 模型配置定义、训练日志以及保存权重等（如有需要可以自己新建新模型的配置文件）： - `📁 vit_base_16`: 重构vit-base-16模型的配置文件： - `📁 logs`: 训练日志文件： - `📁 loss_and_acc_{time}`: {time}时刻开始训练的日志，包含accuracy和loss等的记录； - `📁 weights`: 存放权重文件pth，由于github仓库上传限制，已将在水稻病虫害多分类数据集上预训练的权重上传至 [百度网盘](https://pan.baidu.com/s/1YFkDIgh4RWJphUvqyvBn0g?pwd=1296)，请下载后放入本文件夹； - `config.yaml`: 模型配置文件，包括模型定义超参和训练超参以及数据集路径等； - `📁 vit_base_16_pytorch`: pytorch官方实现vit-base-16模型的配置文件 - `📁 logs`: 训练日志文件： - `📁 loss_and_acc_{time}`: {time}时刻开始训练的日志，包含accuracy和loss等的记录； - `📁 weights`: 存放权重文件pth，由于github仓库上传限制，已将在水稻病虫害多分类数据集上预训练的权重上传至 [百度网盘](https://pan.baidu.com/s/1YFkDIgh4RWJphUvqyvBn0g?pwd=1296)，请下载后放入本文件夹； - `config.yaml`: 模型配置文件，包括模型定义超参和训练超参以及数据集路径等； - `📁 rice_data`: 水稻病虫害数据集，包含各个类别的文件夹以及映射json（之后可以替换为自己的多分类数据集）： - `label2name.json`: 类别索引标签和类别名的对应json字典； - `...📁 类别名`: 每个类别的图片，由于数据集版权问题，这里只能上传少部分图片以供模型测试； ## Usage ### 模型主要用法是使用`VisionTransformer`模块（[vit.py](nets/vit.py)），实例化完成后，仅需传入shape为`[B, C, H, W]`的图像数据即可，可用以下代码进行测试： ```python import torch from nets.vit import VisionTransformer data = torch.randn(8, 3, 224, 224) model = VisionTransformer( image_size=224, patch_size=16, embedding_dim=768, num_classes=10, num_heads=8, num_layers=6) print(model(data).shape) ``` 对于模型配置部分，如需自定义模型超参进行训练，可以通过在`📁 model`中新建模型文件夹，并按照 <u>项目结构介绍</u> 中的文件结构新建`📁 logs`和`📁 weights`文件夹（`📁 loss_and_acc_{time}`不用新建，会自动生成），然后再按照`config.yaml`文件中定义的进行配置即可（[config.yaml](model/vit_base_16_mlp768_head8/config.yaml)）。 ### 数据集加载另外多分类数据集部分主要是使用`MultiClassDataSet`模块（[dataset.py](dataset.py)），仅需在实例化的时候传入数据集路径以及数据集切分要求即可，可用以下代码进行测试： ```python from dataset import MultiClassDataSet from torch.utils.data import DataLoader # 数据集加载路径 file_path_test = r'你的数据集加载路径' batch_size = 8 train_dataset = MultiClassDataSet(file_path=file_path_test, resize=224, mode='train') train_dataloader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True) # 用DataLoader进行一轮批加载测试 for images, labels in train_dataloader: print(images.shape) break ``` ### 训练脚本运行无需多言，修改完`train.py`（[train.py](train.py)）中的 ```python # 配置文件路径 config_yaml_file_path = r'你的配置文件路径' ``` 直接运行即可： ```shell python train.py ``` ### 测试脚本运行和训练脚本类似，修改完`test.py`（[test.py](test.py)）中的 ```python # 配置文件路径 config_yaml_file_path = r'你的配置文件路径' ``` 直接运行： ```shell python test.py ``` ### 预测脚本运行修改完`predict.py`（[predict.py](predict.py)）中的 ```python # 配置文件路径 config_yaml_file_path = r'你的配置文件路径' ``` 直接运行： ```shell python predict.py ``` 之后终端输入要测试的图片路径即可（可以直接拿rice_data中的采样数据测试）。

评论收藏

内容反馈

版权申诉