coco数据集
coco数据集
coco格式包含5个字段信息:info, licenses, images, annotations,categories。上面3种标注类型共享的字段信息有:info、image、license。不共享的是annotation和category这两种字段,他们在不同类型的JSON文件中是不一样的。
1.1 info字段(一般用不到)
1.1.1 格式
info: {
"year": int,# 年份
"version": str,# 版本
"description": str, # 数据集描述
"contributor": str,# 提供者
"url": str,# 下载地址
"date_created": datetime
}
1.1.2例子
"info":{
"description":"This is stable 1.0 version of the 2014 MS COCO dataset.",
"url":"https:\/\/siteproxy.ruqli.workers.dev:443\/http\/mscoco.org",
"version":"1.0","year":2014,
"contributor":"Microsoft COCO group",
"date_created":"2015-01-27 09:11:52.357475"
},
1.2 licenses字段(一般用不到)
1.2.1 格式
license{
"id": int,
"name": str,
"url": str,
}
1.2.2 例子
{
"url":"https:\/\/siteproxy.ruqli.workers.dev:443\/http\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/",
"id":1,
"name":"Attribution-NonCommercial-ShareAlike License"
}
1.3 images字段
1.3.1 格式
image{
"id": int,# 图片的ID编号(每张图片ID是唯一的)
"width": int,#宽
"height": int,#高
"file_name": str,# 图片名
#"license": int,
#"flickr_url": str,# flickr网路地址
#"coco_url": str,# 网路地址路径
#"date_captured": datetime # 数据获取日期
}
1.3.2 例子
{
"license":3,
"file_name":"COCO_val2014_000000391895.jpg",
"coco_url":"https:\/\/siteproxy.ruqli.workers.dev:443\/http\/mscoco.org\/images\/391895",
"height":360,"width":640,"date_captured":"2013-11-14 11:18:45",
"flickr_url":"https:\/\/siteproxy.ruqli.workers.dev:443\/http\/farm9.staticflickr.com\/8186\/8119368305_4e622c8349_z.jpg",
"id":391895
}
1.4 annotations字段 标签信息
1.4.1 格式
annotation{
"id": int, # 对象ID,因为每一个图像有不止一个对象,所以要对每一个对象编号(每个对象的ID是唯一的)
"image_id": int,# 对应的图片ID(与images中的ID对应)
"category_id": int,# 类别ID(与categories中的ID对应)
"segmentation": RLE or [polygon],# 对象的边界点(边界多边形,此时iscrowd=0)。#分割任务
#segmentation格式取决于这个实例是一个单个的对象(即iscrowd=0,将使用polygons格式)还是一组对象(即iscrowd=1,将使用RLE格式)
"area": float,# 区域面积
"bbox": [x,y,width,height], # 定位边框 [x,y,w,h],xmin ymin
"iscrowd": 0 or 1 #见下0:segmentation就是polygon格式,1:segmentation就是RLE格式
}
每个对象(不管是iscrowd=0还是iscrowd=1)都会有一个矩形框bbox,矩形框左上角的坐标和矩形框的长宽会以数组的形式提供,数组第一个元素就是左上角的横坐标值。
polygon格式比较简单,这些数按照相邻的顺序两两组成一个点的xy坐标,如果有n个数(必定是偶数),那么就是n/2个点坐标。
1.4.2 例子
{
"segmentation": [[510.66,423.01,511.72,420.03,510.45......]],
"area": 702.1057499999998,
"iscrowd": 0,
"image_id": 289343,
"bbox": [473.07,395.93,38.65,28.67],
"category_id": 18,
"id": 1768
}
1.5 categories字段 类别信息
1.5.1 格式
{
"supercategory": str,# 主类别
"id": int,# 类对应的id (0 默认为背景)
"name": str # 子类别
}
1.5.2 例子
{
"supercategory": "person",
"id": 1,
"name": "person"
},
{
"supercategory": "vehicle",
"id": 2,
"name": "bicycle"
}