机器视觉字符识别中的深度学习技术-低调大师

机器视觉字符识别中的深度学习技术

2018-04-26 702

光学字符识别（OCR）是工业环境中的重要技术。工业智能相机及机器视觉方案提供商朗锐智科(www.loongv.com)认为，OCR技术在办公室通信中尤为出色。纸张文件（如发票，发货单和其他记录）的扫描可以将其快速转换为数字格式，从中提取相关信息，并将这些数据整合到一个连续的电子信息流中。
机器视觉使得可以基于印刷或冲压字符可靠地识别整个价值链中的工件和产品。借助于现代深度学习技术和卷积神经网络（CNN），某些字体可以以字体识别率显着提高的方式进行训练。该方法也在工业设计和生产过程中发挥关键作用，特别是在工业4.0或工业物联网的背景下。印刷字母或数字组合使得可以清楚和快速地识别组件并使其可用于自动化过程链。
使用光学字符识别，诸如扫描仪和摄像机之类的图像采集设备记录数字图像信息，并将其转换成光栅图形，将文本精确地表示为最后一个像素。 OCR软件读出这些图形，识别数字组合或字母，并将它们组合成单词或甚至整个句子。机器视觉技术支持设计和生产过程中字符组合的光学识别。这些技术包括针对工业环境的特殊要求的特定功能。
例如，经过深思熟虑的分类技术即使在困难的条件下也能确保非常高的识别率。也可以毫无问题地识别模糊或倾斜的文字，即使是打印到或蚀刻到反射表面或高度纹理的彩色背景上的扭曲的字母或字符。
深度学习技术的特点是分析大量的数字图像数据，从而训练必须识别的某些对象的模型。这对于物理对象以及字母或数字都有用。标签附加到标识对象的数据，例如“狗”或“字母A”。现在可以基于经过训练的模型对新记录的图像信息的内容进行可靠的声明。因此，每当新图像被“标记”时，该技术就会得到学习。这增加了可靠地识别尽可能多的不同版本的图像内容的可能性，例如其他种类的狗或具有变化的字体或形状的字符。
由于工业应用需要更快和更灵活的过程，人造智能技术也被纳入到机器视觉中。因此，深度学习算法和人工神经网络（如CNN）可以确保文本识别更加强大的结果。

微信关注我们

原文链接：https://yq.aliyun.com/articles/585488

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

用物联网加速数字城市建设阿里云交出这份答卷

联物为城，聚贤为市，在4月26日举行的2018南京云栖大会上，阿里云首次解析了数字城市的三种密码：基础设施数字化、统一的物联网平台及创新的生态协同。“阿里云IoT的使命是物理世界抽象到数字世界，让数据在数字世界里流动和计算，从而更有效的提高生产力。”阿里云首席智联网科学家柯镇表示。在无锡鸿山小镇，每一个路灯、每一条河流、每一个煤气管道都配备了数据上云的传感器，通过城市物联网平台，不仅是交通，垃圾桶、路灯、井盖甚至是救护车……已经全部互联互通，一个智能的小镇初露芳容。有灵性的市政设施：万物互联带来新生机老王是鸿山小镇的一名环卫工人。以前，他常被塞得满满的垃圾桶困扰，在人群密集的地方，垃圾桶洒出来的残渣很难清理，老王常常被忽忙忽松的工作节奏困扰。但最近几个月，老王的工作悄然发生了变化，垃圾桶忽然变得“灵性”了起来——垃圾桶溢满后，会自

2018-04-26

663

在经历了互联网和移动互联网的追赶之后，中国正成为一个重要的数据大国，预计到2020年中国将拥有全球数据量的20%-25%。而推动这一波人工智能发展的最重要的因素之一就是数据。中国的人工智能市场，可以大致分成数据中心/云端训练和推理、边缘(雾)计算推理(和训练)以及设备端的推理等三个大类四个小类。嵌入式开发服务商朗锐智科(www.lrist.com)认为,数据中心/云端训练和推理的市场机会已被业界广泛接受，并随着人工智能的实际应用而进一步迎来爆发式增长。由于在云端，尤其是训练部分需要更大的灵活度来迎合不可预期的应用和数据增长，预计英特尔CPU+AI加速卡的计算平台将进一步发展，其中推理部分的计算平台，尤其是在应用场景比较明确的情况下，将CPU和低功耗AI加速芯片的多芯片合封的MCP(Multiple-chip Package)将是未来的一个选择。在设备端侧推理部分，由于要求较好的功耗控制、尺寸大小以及性价比，预计集成AI加速IP的SoC将最终是一个趋势。在市场层面，一些大的领导企业如苹果、华为等正研发类似方案应用到他们最新的智能手机产品上。由于市场趋势相对明确但应用模式仍需要时...

2018-04-26

692

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。