图像数据收集与处理:从数据获取到模型训练准备
1. 数据收集的重要性与目标
在实际应用中,模型的实现不仅仅是训练一个模型那么简单,还需要进行实验来收集更多数据,并考虑如何将模型集成到正在开发的整个系统中。本文以构建一个熊探测器为例,该探测器要区分三种类型的熊:灰熊、黑熊和泰迪熊。
2. 在线数据收集
对于许多项目而言,我们可以在网上找到所需的所有数据。目前,Bing图像搜索是查找和下载图像的不错选择,每月最多可进行1000次免费查询,每次查询最多可下载150张图像。
2.1 注册并获取API密钥
要使用Bing图像搜索下载图像,需在Microsoft注册一个免费账户,获取密钥。可以通过以下两种方式设置密钥:
- 在Jupyter单元格中设置:
key = 'XXX' # 将XXX替换为你的密钥
- 在命令行中设置:
export AZURE_SEARCH_KEY=your_key_here
然后重启Jupyter服务器,在单元格中执行:
key = os.environ['AZURE_SEARCH_KEY']
2.2 下载图像URL
设置好密钥后,就可以使用 search_images_bing