学习Pytorch+Python之自定义数据集(创建CSV文件)

最新推荐文章于 2025-07-27 11:48:48 发布

擦干净的橡皮擦

最新推荐文章于 2025-07-27 11:48:48 发布

阅读量4.4k

点赞数 3

CC 4.0 BY-SA版权

文章标签： python pytorch 深度学习

本文链接：https://blog.csdn.net/weixin_42744921/article/details/120617569

1、CSV文件
逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。文件格式如下图，也可用Excel打开。
在这里插入图片描述
2、简单分类数据集
本文数据集是一个蚂蚁(ants)和蜜蜂(bees)的简单的二分类数据，分别存放于dataset文件夹下的ants_image和bees_image文件夹下，用文件夹名字作为标签。
3、创建CSV文件代码

# 导入相关库
import csv
import random
import os
import glob
# 数据地址，注意是分类文件夹的上层文件夹
# dataset文件夹中的两个子文件夹分别对应两个类名
root = 'dataset'
# 对数据地址中的文件夹进行遍历，将类名存放于列表names中
names = os.listdir(root)
# 创建名为images的空列表用于存放图像地址
images = []
# 创建名称、标签字典，用于存放二分类的类名和标签
names_labels