YOLOv5全面解析教程②：如何制作训练效果更好的数据集-低调大师

YOLOv5全面解析教程②：如何制作训练效果更好的数据集

2022-12-22 829

撰文 | Fengwen, BBuf

本文主要介绍 One-YOLOv5 使用的数据集格式以及如何制作一个可以获得更好训练效果的数据集。本节教程的数据集标准部分翻译了 Ultralytics/YOLOv5 wiki 中对数据集相关的描述(https://github.com/ultralytics/yolov5/wiki/Tips-for-Best-Training-Results) 。

代码仓库地址：

https://github.com/Oneflow-Inc/one-yolov5

本系列教程原文点击

https://start.oneflow.org/oneflow-yolo-doc 可达（保持动态更新教程和源码解读和修复一些bug）。

1

数据集结构解读

1. 创建dataset.yaml

COCO128是官方给的一个小的数据集由COCO（ https://cocodataset.org/#home）数据集前 128 张图片组成。这128幅图像用于训练和验证，判断 YOLOv5 脚本是否能够过正常进行。

数据集配置文件 coco128.yaml

(https://github.com/Oneflow-Inc/one-yolov5/blob/master/data/coco128.yaml) 定义了如下的配置选项：

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license# COCO128 dataset https://www.kaggle.com/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics# Example usage: python train.py --data coco128.yaml# parent# ├── one-yolov5# └── datasets#     └── coco128  ← downloads here (7 MB)
# train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
# 训练和验证图像的路径相同train: ../coco128/images/train2017/ val: ../coco128/images/train2017/
# number of classesnc: 80 # 类别数
# class names 类名列表names: ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light',        'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow',        'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee',        'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard',        'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',        'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch',        'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard',         'cell phone', 'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors',         'teddy bear', 'hair drier', 'toothbrush']

# Download script/URL (optional) 用于自动下载的可选下载命令/URL 。download: https://ultralytics.com/assets/coco128.zip

注意：如果是自定义数据集的话按自己需求修改这个yaml文件。主要修改以下两点。

修改训练和验证图像的路径为自定义数据集路径
修改类别数和类名列表

再展示一下 coco.yaml 的数据集路径配置，这里的训练和验证图像的路径就是直接用txt表示：

2. 创建 Labels

使用工具例如 CVAT (https://github.com/opencv/cvat) , makesense.ai (https://www.makesense.ai/``) ， Labelbox (https://labelbox.com/``) ， LabelImg(在下一节制作数据集中介绍LabelImg工具使用) 等，在你自己的数据集提供的图片上做目标框的标注，将标注信息导出为一个txt后缀结尾的文件。（如果图像中没有目标，则不需要*.txt文件）。

*.txt文件规范如下所示:

每一行一个目标。
每一行是 class x_center y_center width height 格式。
框坐标必须采用标准化xywh格式（从0到1）。如果框以像素为单位，则将x_center和width除以图像宽度，将y_centre和height除以图像高度。
类号为零索引的编号（从0开始计数）。

这里假设以 COCO 数据集的目标类别约定来标注

与上述图像相对应的标签文件包含2个人（class 0）和一个领带（class 27）：

3. COCO128 数据集目录结构组织

在本例中，我们的 coco128 是位于 YOLOv5 目录附近。YOLOv5 通过将每个图像路径 xx/images/xx.jpg 替换为 xx/labels/xx.txt 来自动定位每个图像的标签。例如：

dataset/images/im0.jpg  # imagedataset/labels/im0.txt  # label

coco 和 coco128 数据集组织结构

2

制作数据集

1. 数据集标注工具

这里主要介绍 LabelImg 是一种矩形标注工具，常用于目标识别和目标检测，可直接生成 YOLOv5 读取的txt标签格式，但其只能进行矩形框标注（当然也可以选用其它的工具进行标注并且网上都有大量关于标注工具的教程。）

首先labelimg的安装十分简单，直接使用cmd中的pip进行安装，在cmd中输入命令行：

pip install labelimg

安装后直接输入命令：

labelimg

即可打开运行。

点击Open Dir选择数据集文件夹，再点击Create RectBox进行标注。

当你绘制框结束就会弹出标签选择框，然后标注类别。这个类别编辑更改在Labelimg文件里，里面有classes.txt文档，打开手动更改类别即可（当出现新类别时也可在标签选择框里输入点OK就自动添加类别了）。

标注好后选择 yolo 格式，点击 Save 保存。标注结果保存在图片名.txt文件中，txt文件和图片名称一致，内容如下：

3

一个好的数据集标准？

每个类的图像。>= 1500 张图片。
每个类的实例。≥ 建议每个类10000个实例（标记对象）
图片形象多样。必须代表已部署的环境。对于现实世界的使用案例，我们推荐来自一天中不同时间、不同季节、不同天气、不同照明、不同角度、不同来源（在线采集、本地采集、不同摄像机）等的图像。
标签一致性。必须标记所有图像中所有类的所有实例。部分标记将不起作用。
标签准确性。
标签必须紧密地包围每个对象。对象与其边界框之间不应存在任何空间。任何对象都不应缺少标签。
标签验证。查看train_batch*.jpg 在训练开始验证标签是否正确，即参见 mosaic （在 YOLOv5 的训练日志 runs/train/exp* 文件夹里面可以看到）。
背景图像。背景图像是没有添加到数据集以减少 False Positives（FP）的对象的图像。我们建议使用大约0-10%的背景图像来帮助减少FPs（COCO有1000个背景图像供参考，占总数的1%）。背景图像不需要标签。

下图展示了多种数据集的标签特点：

其中：

Instances per category 表示每个类别的实例数
Categories per image 表示每幅图像的类别
(a) Instances per image 表示每幅图像的实例数
(b) Number of categories vs. number of instances 表示类别数目 vs 实例数目（我们可以看到 COCO 数据集的类别和实例的数目达到了一个较好的平衡）
(c) Instance size 表示实例个数
(d) Number of categories 表示类别数
(e) Percent of image size 表示图像大小百分比

4

参考文章

https://github.com/ultralytics/yolov5/wiki/Tips-for-Best-Training-Results
https://docs.ultralytics.com/tutorials/train-custom-datasets/#weights-biases-logging-new

其他人都在看

欢迎 Star、试用 OneFlow 最新版本：https://github.com/Oneflow-Inc/oneflow/

本文分享自微信公众号 - OneFlow（OneFlowTechnology）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/oneflow/blog/5640164

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Windows 11 记事本新增标签页 (Tabs) 功能

微软员工在一条现已删除的推文中“泄露”了新版 Windows 记事本的截图。这名员工是微软的高级产品经理，他发布了一张记事本应用的截图（如下图所示），并配文称“Windows 11 的记事本终于有标签页 (Tabs) 功能了”。截图中有一条格外引人注目的机密警告信息，上面写着“不要讨论功能或进行屏幕截图”。这说明微软尚未准备好向大众开放测试此功能。和大多数包含标签页的应用程序一样，Windows 11 记事本的标签页也位于应用的顶部，方便用户在同一窗口中打开多个文本文件。对于用户来说，该功能将提升在多个文档页面之间切换的效率，同时也能够比打开多个记事本页面消耗更少的内存空间。按照目前的情况，包含标签页的记事本很可能会在接下来的几周内以预览版的形式发布到 Windows Insiders。在记事本添加标签页功能标志着将会有更多内置的 Windows 应用程序包含此特性，那么问题来了，微软接下来会为哪些应用添加标签页功能？

2022-12-27

502

本文作者，符尧 yao.fu@ed.ac.uk ，爱丁堡大学 (University of Edinburgh) 博士生，本科毕业于北京大学，与彭昊，Tushar Khot在艾伦人工智能研究院 (Allen Institute for AI) 共同完成英文原稿，与剑桥大学郭志江共同翻译为中文，感谢上海交通大学何俊贤，加州大学洛杉矶分校鲁盼，达特茅斯学院刘睿博对初稿的讨论与建议。感谢 Raj Ammanabrolu (Allen Institute for AI), Peter Liu (Google Brain), Brendan Dolan-Gavitt (New York University), Denny Zhou (Google Brain) 对终稿的讨论和建议，他们的建议极大程度上增加了本文的完整度。英文版原文：https://franxyao.github.io/blog.html 最近，OpenAI的预训练模型ChatGPT给人工智能领域的研究人员留下了深刻的印象和启发。毫无疑问，它又强又聪明，且跟它说话很好玩，还会写代码。它在多个方面的能力远远超过了自然...

2022-12-21

470

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。