一、背景知识
Pascal VOC
Pascal VOC(Pattern Analysis, Statical Modeling and Computational Learning和Visual Object Classes)是一个知名的计算机视觉数据集,专注于目标检测、图像分割等任务。它包含20个不同物体类别的图像注释,如人、动物、交通工具等。Pascal VOC挑战赛自2005年至2012年每年举办,其中VOC2007和VOC2012是两个广泛使用的版本。VOC2007包含9963张标注过的图片,由train/val/test三部分组成,共标注出24,640个物体。VOC2012 包含 11,530 张图像。与 VOC2007 类似,这些图像也被分为训练集、验证集和测试集。
MMDetection
MMDetection是一个开源的目标检测框架,由中国科学院自动化研究所的多媒体实验室(MMLab)开发和维护。它基于 PyTorch 构建,旨在提供一个灵活、易于扩展和高效的目标检测工具。MMDetection 支持多种目标检测任务,包括但不限于: