OCR产业应用实战，多类别电表读数识别方案详解-低调大师

OCR产业应用实战，多类别电表读数识别方案详解

2022-02-28 730

我国电力行业发展迅速，电表作为测电设备经历了普通电表、预付费电表和智能电表三个阶段的发展。在产业场景中，表的种类多达十几种，过去依赖人工抄表，成本很高。如果能够采集到大量电表图片，借助人工智能技术批量检测和识别，将会大幅提升效率。

本次飞桨产业实践范例库开源电表读数识别场景应用，提供了从数据准备、技术方案、模型训练优化，到模型部署的全流程可复用方案，降低产业落地门槛。

⭐项目链接⭐

https://github.com/PaddlePaddle/awesome-DeepLearning

所有源码及教程均已开源，欢迎大家使用，star鼓励~

基于深度学习技术

实现电表读数识别

本场景要解决多类别电表识别任务，从技术上需要对多种类别的电表表数和表号进行检测再识别，从数据到模型面临着多重问题。

项目难点：

在数据方面，电表种类多、数据少、拍摄角度多样且部分数据反光严重。

如何从零标注电表数据，选择何种标注软件能够最快速度构建数据集？

技术路线的选择也面临多方面的问题，例如是通过文字检测来反向微调，还是通过目标检测从零训练？

本项目将一一解决这些难点。

项目方案：

基于上述难点，飞桨开发者技术专家不断进行尝试，最终选用了飞桨文字识别套件PaddleOCR中的PP-OCR模型进行了微调与优化，其检测部分基于DB的分割方法实现，直接解决了电表数据中的倾斜问题，通过再造数据集来扩充识别数据集，训练识别模型。PP-OCR模型经过大量实验，其泛化性也足以支撑复杂垂类场景下的效果。

在数据标注工具上，使用PPOCRLabel实现半自动标注，内嵌PP-OCR模型，一键实现机器自动标注，且具有便捷的修改体验。支持四点框、矩形框标注模式，导出格式可直接用于PaddleOCR训练，标注效率显著提升。

方案优化：

在优化方面，首先对PP-OCR模型的检测部分进行初步微调，然后通过对数据的进一步分析，发现原始图像分辨率较大，进而调整EastRandomCropData的尺寸，放大输入模型前的图像尺度。通过CopyPaste数据增强解决数据量小的问题，并且根据实际情况调小学习率。

项目效果：

最终在评测数据集上从原先的Hmeans=0.3优化到0.85。除此之外，本项目也尝试了一部分目标检测算法。具体的优化过程和详细解释，欢迎大家关注直播！

微调前后对比

部署方面使用飞桨原生推理库Paddle Inference完成，满足用户批量预测、数据安全性高、延迟低的需求，快速在本地完成部署方案。

产业实践范例教程

助力企业跨越AI落地鸿沟

飞桨产业实践范例，致力于加速AI在产业落地的前进路径，减少理论技术与产业应用的差距。范例来源于产业真实业务场景，通过完整的代码实现，提供从数据准备到模型部署的方案过程解析，堪称产业落地的“自动导航”。

真实产业场景：与实际具有AI应用的企业合作共建，选取企业高频需求的AI应用场景如智慧城市-安全帽检测、智能制造-表计读数等；

完整代码实现：提供可一键运行的代码，在“AI Studio一站式开发平台”上使用免费算力一键Notebook运行；

详细过程解析：深度解析从数据准备和处理、模型选择、模型优化和部署的AI落地全流程，共享可复用的模型调参和优化经验；

直达项目落地：百度高工手把手教用户进行全流程代码实践，轻松直达项目POC阶段。

精彩课程预告

为了让小伙伴们更便捷地应用电表读数范例教程，我们邀请了飞桨开发者技术专家于3月3日20:30-21:00为大家深度解析从数据准备、方案设计到模型优化部署的开发全流程，手把手教大家进行代码实践。

欢迎小伙伴们扫码进群，免费获取直播课和回放视频链接，更有机会获得覆盖智慧城市、工业制造、金融、互联网等行业的飞桨产业实践范例手册！也欢迎感兴趣的企业和开发者与我们联系，交流技术探讨合作。

扫码报名直播课，加入技术交流群

关注飞桨公众号，获取更多技术内容~

本文同步分享在博客“飞桨PaddlePaddle”（CSDN）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/4067628/blog/5470641

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

iOS自动化测试驱动工具探索

本文主要介绍了字节 iOS 自动化测试驱动工具的探索过程及实现原理作者：字节跳动终端技术——陈友辉一、背景随着业务的扩张，单个 App 的功能越来越多，工程复杂度越来越高，每天MR可达上百次，代码变更可达上千处，航母级的 App 在这一点上更为严重。如何在频繁的代码变更中保障App质量，成了各个业务的痛点。靠传统的人工测试已无法满足各业务的需求，我们需要将更多的测试场景自动化。自动化测试需要将人工交互行为变成自动化的原子操作。比如应用安装卸载、屏幕点拖拽及缩放、实体按键点击、设备信息获取、应用启停等等。这就需要一款工具来驱动 iOS 设备完成以上操作。这篇文章主要介绍字节 iOS 自动化测试驱动工具 bdc 的探索过程及实现原理。二、功能介绍在介绍 bdc 的探索过程及实现原理之前，先介绍一下 bdc 的能力：三、探索历程早期方案在字节开始大规模建设自动化建设时，Android 已经有较为完善的解决方案，包括其生态自带的驱动工具 adb 及开源的云真机管理平台 STF。但 iOS 在这方面相对滞后，主要是 iOS 缺少一款类似 adb 功能齐全且稳定的驱动工具。早期...

2022-03-01

544

数字经济的快速发展，给企业的经营带来了新的机遇和挑战，如何有效开展数据治理，打破数据孤岛，充分发挥数据的业务价值，保护数据安全，已成为业界的热门话题。本文基于美团配送数据治理的历程，分享了数据定义、模型设计、数据生产三环节统一的配送数据“底座”的建设与实践。 1 前言随着数字经济的快速发展，数据已经成为新的生产要素。如何有效地开展数据治理工作，提升数据质量，打破数据孤岛，充分发挥数据的业务价值，已成为业界的热门话题。本文基于美团配送数据治理的历程，重点和大家分享一下配送数据“底座”的建设与实践，如何通过体系化建模建立起数据定义到数据生产的桥梁，达成数据定义、模型设计、数据生产三个环节的统一，消除因数据标准缺失和执行不到位引发的数据信任问题，在高质量地实现数据到信息的转化的同时，为后续的数据便捷消费提供数据和元数据保障。希望能给从事数据治理方向的同学在实现数据到资产的转化过程提供一些参考和借鉴。 2 什么是体系化建模体系化建模是以维度建模为理论基础，以事前治理的理念驱动，让元数据贯穿其中的建模流程，上承指标、维度的定义，下接实际的数据生产。首先，通过高层模型设计，将业务指标结构化拆解...

2022-03-01

537

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。