比赛分析(完整版)

发布时间 2023-04-23 20:21:38作者: yonuyeung

一、数据分析

该数据集采用COCO格式给出标注信息,即将所有训练图像的标注都存放到一个json文件中,数据以字典嵌套的形式存放。

对数据集进行分析:

检测数据集涉及3个场景,分别是“火灾检测”、“工业仪表检测”和“安全帽检测”,共7114张图像。这些图像按8:2的比例划分为训练集、验证集,即训练集中有5691张图像,验证集中有1423张图像。

keys: dict_keys(['images', 'type', 'annotations', 'categories'])

物体类别: [{'supercategory': 'none', 'id': 1, 'name': 'fire'}, {'supercategory': 'none', 'id': 2, 'name': 'head'}, {'supercategory': 'none', 'id': 3, 'name': 'helmet'}, {'supercategory': 'none', 'id': 4, 'name': 'person'}, {'supercategory': 'none', 'id': 5, 'name': 'meter'}]

图像数量: 5691

图像信息: {'file_name': '001772.jpg', 'height': 932.0, 'width': 1000.0, 'id': 0}

标注物体数量: 23053

查看一条目标物体标注信息: {'area': 472632.0, 'iscrowd': 0, 'bbox': [310.0, 58.0, 564.0, 838.0], 'category_id': 1, 'ignore': 0, 'image_id': 0, 'id': 1}