关于图文识别功能相关技术的大致实现-低调大师

关于图文识别功能相关技术的大致实现

2018-05-07 601

　　　　关于图文识别功能相关技术的实现

转载请注明源地址：http://www.cnblogs.com/funnyzpc/p/8908906.html

　　上一章，写的是SSL证书配置，中间折腾了好一会，在此感谢SSL证书发行商的协助；这次我就讲讲ocr识别的问题，先说说需求来源吧。。。

　　之前因为风控每次需要手动P协议文件和身份证(脱敏)，还要识别证件及图片文件的内容，觉得狠狠狠麻烦，遂就找到了技术总监，技术总监一拍脑袋，额，小邹啊。。。

　　呃，一开始并没抱太大希望，不过还是花了些心思做了些需求实现的调研，怎么办 google、duckduckgo、github一路找下来就有了几个工程了，嘿嘿~，可惜还没高兴到，没想到的是这些工程一个比一个坑，不是依赖windows系统组件就是代码bug不断，作者们，能用点儿心么

　　日夜操劳，加班啊，总算是将几个工程全都修得能跑起来了，大费周折。。。难得啊

　　欸，可惜效果均不佳；现开始，我总结下一些主流的图文识别技术，只是浅聊哦。。。

首先，这些工程大致分两类：

　　一类是纯算法，不附带机器学习功能的，且需要依赖于window系统组件的工程，比如tesseract和tess4j，识别效果可以说是巨差(可能我的技术很菜的原因)，但有一点儿值得赞许，就是识别结果的格式还算不错，这类图文识别的特点大致有如下几点：

　　A>工程代码量较大

　　B>依赖window组件，需要在window系统下才能运行

　　C>识别效果无法通过学习逐渐优化

　　D>识别出来的文字时常乱码，中文识别乱码错别字较多

　　E>识别结果通常使用格式化模子来格式化结果，遂，识别结果的格式还算过得去

　　一类是基于机器学习(比如Tensorflow)的工程，这些工程参差不齐，存在插件版本问题，尤其是python插件，实在在太太太难装了，在一就是工程大多较为简陋，由于机器学习具有不断改善的趋势，这是基于机器学习的图文识别的最大优势，总结起来，基于机器学习的图文识别的特点儿大致有如下几点：

　　A>工程比较简单，代码量不是很多

　　B>依赖的语言插件，如python实在难以安装

　　C>有很多优化的方向，比如使用显卡，优化算法(卷积神经网络)来提高识别速度及模型准确度

　　D>十分耗费计算机字段，一般识别一页A4大小的图片中的内容，(我使用Macbook Pro) 最快也用了二十多秒

　　E>识别的结果比较乱，但对于中文，尤其是图片较好的中文的文字识别准确率能达到百分之七十网上，但是识别格式和文字准确度不如上者

　　F>由于是基于机器学习，遂需要大量的数据喂养以提高识别的准确率，喂养的数据十分可观

　　额，总的来说，后者的优势较大，也是趋势，比如腾讯QQ的图片识别还有百度大脑AI这些基本都是基于机器学习，个人觉得，如果投入一个团队去专门研究开发一个图文识别的产品，也是比较容易实现的，何况这个方向向前走就是人工智能，尽管现在看起来有些智障...。

　　哦，大致总结完了，我就展示下基于tess4j和chinese-ocr这两项目的实现效果，我的输入是身份证：

(注意:源图片是从github上拉下来的，个人做了些简陋的脱敏处理!)

　　下面是基于tess4j实现的结果:

tess4j的实现只能基于windows组件实现，故项目只能在windows下运行，另外tesseract也是windows组件的实现。

　　一下是基于chinese-ocr的项目的实现的结果：

chinese-orc是基于python语言+tensorflow的实现，结果一目了然，需要说的是，一下几个也是基于=>

　　 IITG-Captcha-Solver-OpenCV-TensorFlow:基于Tensorflow实现的验证码识别，已调试通过，验证码模糊度较高的识别不够准确
　　text-detection-ctpn　　　　　　　：基于Tensorflow实现的图片识别，未调试通过
　　tensorflow-ocr　　　　　　　　　：基于tensorflow实现的图片识别，未调试通过

由于github共享的工程参差不齐，存在插件版本、语言以及系统版本的差异，遂这些项目clone下来后需要修改些bug才可，这里简述下一些大致的问题的解决思路：

　　A>对于插件版本下载不了的(我用的是pycharm)，建议使用相邻版本的插件，但有些插件需要爬梯出去才可下

　　
　　B>对于部分(例如 test.py)文件跑不起来的，请尝试着将这个文件放置在工程主目录下，但同时请注意 import引用的文件(可能需要手动修改)

　　C>对于项目出现的主流问题请移步Issues以查找

嗯，此篇原本在前一天发表的，由于公司周年庆耽搁了会儿，最后，我把上面几个工程的打包文件共享下(包含我修改过bug的)，有需要的请自行下载，如有疑问请电邮或留言

。

工程下载链接: https://pan.baidu.com/s/1B2Eyak8zwdAldA0NBfmlvw

工程下载密码: r2av
　　

funnyzpc@gmail.com

微信关注我们

原文链接：https://yq.aliyun.com/articles/618790

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

eBPF监控工具bcc系列三自定义工具trace

上篇中是通用的直接可用工具。 trace工具可以指定跟踪函数并显示，可控制其输出格式来显示函数参数和返回值。例如跟踪文件拥有者的属性更改，也就是跟踪三个文件系统调用chown,fchown,lchown。使用如下： trace.py 'p::SyS_chown "file = %s, to_uid = %d, to_gid = %d, from_uid = %d", arg1, arg2, arg3, $uid' 'p::SyS_fchown "fd = %d, to_uid = %d, to_gid = %d, from_uid = %d", arg1, arg2, arg3, $uid' 'p::SyS_lchown "file = %s, to_uid = %d, to_gid = %d, from_uid = %d", arg1, arg2, arg3, $uid' 例如跟踪非主动上下文切换。 trace.py -p 1134138 't:sched:sched_switch (args->prev_state == TASK_STATE_MAX || args-&gt...

2018-05-07

854

1). 在/usr/下创建java文件夹 [root@localhost /]# cd /usr/ [root@localhost usr]# mkdir java 图1.png 2). jdk下载 -- 根据自己电脑系统的版本选择对应的安装包注：下载前要先勾选Accept License Agreement 图2.png 3). 将文件复制到/usr/java/文件夹下 cp /mnt/hgfs/share/jdk-8u171-linux-i586.tar.gz /usr/java/jdk-8u171-linux-i586.tar.gz 4). 进入到/usr/java/文件夹下，解压文件 tar -zxvf jdk-8u171-linux-i586.tar.gz 5). 设置环境变量编辑文件 vi /etc/profile 在文件的末尾添加以下内容 #set java environment JAVA_HOME=/usr/java/jdk1.8.0_171 JRE_HOME=/usr/java/jdk1.8.0_171/jre CLASS_PATH=.:$JAVA_HOME/l...

2018-05-07

796

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。