机器学习服务文本识别能力演进，大幅提升识别准确率-低调大师

机器学习服务文本识别能力演进，大幅提升识别准确率

2022-10-27 480

文本识别技术（OCR）可以识别收据、名片、文档照片等含文字的图片，将其中的文本信息提取出来，代替了人工信息录入与检测等操作，降低了输入成本，快速、方便，提升产品的易用性。

随着技术的发展，OCR已经深入生活的诸多方面。交通场景下，主要用于车牌识别，便于停车场管理、智能交通、移动警务等；生活场景下，主要用于证照识别，便于提取身份证、银行卡、护照、结婚证、户口本、营业执照等证照图像的文字信息，还可对街景路牌进行识别；票据场景下，主要用于发票凭证识别，便于银行、税务等大量票据表格录入及长期存储；其他场景下，可以利用OCR对书籍、报告、简历、合同等文件进行识别，将纸质文件电子化，便于保存和查看。

Demo

HMS Core机器学习服务OCR能力在2020年01月15日首次上线，为开发者们提供了丰富的API接口，HMS Core OCR能力支持任意角度的文本识别，对横竖排、弯曲文本精准识别的同时，还能对文本段落进行准确划分，对文本内容精确定位。为了保证一些卡证、票据的隐私性，HMS Core OCR能力还支持端侧和云侧推理，端侧适合相机或视频画面实时处理，图片中稀疏文本识别，当调用端侧接口时，可识别中文（简体）、日文、韩文、拉丁语（包括英文、西班牙文、葡萄牙文、意大利文、德文、法文、俄文）10个语种；云侧对文字识别精度要求高，适合图片中稀疏文本识别、文档图片密集文本识别，当调用云侧接口时，可以识别中文（简体）、英文、西班牙文、葡萄牙文、意大利文、德文、法文、俄文、日文、韩文、波兰文、芬兰文、挪威文、瑞典文、丹麦文、土耳其文、泰文、阿拉伯文、印地文19个语种，核心语种的识别精度达到行业顶尖水平。

基于用户需求和技术进步，HMS Core 机器学习服务OCR能力进行了升级优化：端侧模型轻量化、准确率提升。

能力演进：

1、端侧模型轻量化：文本识别端侧10个语种能力增强（模型层面）

KPI不变，端侧模型轻量化压缩42%，运行所占内存从之前版本的19.4M降到11.1M左右。

模型的轻量化将模型体积缩小，并且可以轻量化展示，内存占比小，运行更加流畅。

2、准确率提升：云侧OCR能力演进（中文模型)

云侧OCR中文识别准确率从87.62%提升到92.95%，高于行业平均水准，竞争力大幅提高。

技术描述：

OCR是通过检测纸上的字符，以检测暗、亮的方式确定其形状，而后用字符识别法将形状翻译成计算机文字的过程。即针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并经过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。

由于通用领域中存在大量弯曲文本的情况，算法团队通过重新设计文本检测模型，在横向文本的基础上，增加了任意旋转角度、弯曲文本的支持，使得在出行、广告牌等场景下的准确率和易用性大大增加。

文本识别还支持纯端侧推理，在涉及各类卡证、票据等隐私信息的场景下，相比云侧服务更加安全、可靠。考虑到端侧设备的算力、功耗等因素，算法团队通过巧妙的模型框架设计、量化、剪枝等技术，在保证识别精度的情况下，将识别模型压缩到商用的标准，保证用户的使用体验。

竞品对比：

OCR能力演进后，端侧和云侧的识别准确率都在业界属于领先地位。

云侧平均准确率高于竞品约7%，时延仅为竞品的55%。

端侧平均准确率和模型体积均优于竞品，一些小语种的准确率甚至达到95%。

优化更新：

基于现在市面上OCR能力大多只针对印刷体字符， HMS Core机器学习服务正在进行通用手写体识别能力的开发（手写体识别、手写体+印刷体混合识别）。
加入更多语种，预计新增罗马尼亚语、马来语、菲律宾语等。
预计新增版面分析功能（PDF重排），机器学习服务支持多种内容识别处理功能，提升自身AI能力竞争力。

为了满足众多场景需要，HMS Core会不断开发新功能帮助开发者构建多元化应用，后续新增功能以华为HMS Core机器学习服务联盟官网为准。

了解更多详情>>

访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址：GitHub、Gitee

关注我们，第一时间了解 HMS Core 最新技术资讯~

微信关注我们

原文链接：https://my.oschina.net/HMSCore/blog/5586482

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

这TMD，就是你说的Spring IoC源码

回答：我们为什么要学习源码？ 1、知其然知其所以然 2、站在巨人的肩膀上，提高自己的编码水平 3、应付面试 1.1 Spring源码阅读小技巧 1、类层次藏得太深，不要一个类一个类的去看，遇到方法该进就大胆的进 2、更不要一行一行的去看，看核心点，有些方法并不重要，不要跟它纠缠 3、看不懂的先不看，根据语义和返回值能知道这个方法达到了啥目的即可 4、只看核心接口（下面标注了重点的地方）和核心代码，有些地方也许你使用spring以来都没触发过 5、debug跟步走，源码中给大家标注好了，见到 ”===>“ 就进去进去之前，下一行打个断点，方便快速回到岔路口进去之前，可以先点方法看源码，再debug跟进 6、广度优先，而非深度优先。先沿着主流程走，了解大概，再细化某些方法 7、认命。spring里多少万行的代码，一部书都写不完。只能学关键点阅读源码目的加深理解spring的bean加载过程面试吹牛x 江湖传说，spring的类关系是这样的…… 1.2 IoC初始化流程与继承关系引言在看源码之前需要掌握Spring的继承关系和初始化 1) IoC容器初始化流程 ...

2022-10-26

446

摘要：随着offset的增加，查询的时长也会越来越长。当offset达到百万级别的时候查询时长通常是业务所不能容忍的。本文分享自华为云社区《offset新探索：双管齐下，加速大数据量查询》，作者： GaussDB 数据库。众所周知，在各类业务中时常会用到LIMIT y offset x来做跳过x条数据读取Y条数据的操作。例如：SELECT * FROM ... LIMIT 1000 OFFSET 1000000; 表示从第1000001条数据开始查，读取1000条数据。随着offset的增加，查询的时长也会越来越长。当offset达到百万级别的时候查询时长通常是业务所不能容忍的。那么如何来提升offset在大数据量查询时的性能、缩短执行时间呢？我们的答案是： offset Pushdown( offset下推，下文简称OP) Redundant Condition Removal (冗余条件删除，下文简称 RCR) 这是华为云GaussDB for MySQL推出的两个新特性，通过OP和RCR的结合，将大数据量查询的性能提升一到两个数量级。下面我们分别介绍这两个特性的基本原理...

2022-10-27

398

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。