关于图文识别功能相关技术的大致实现
关于图文识别功能相关技术的实现 转载请注明源地址:http://www.cnblogs.com/funnyzpc/p/8908906.html 上一章,写的是SSL证书配置,中间折腾了好一会,在此感谢SSL证书发行商的协助;这次我就讲讲ocr识别的问题,先说说需求来源吧。。。 之前因为风控每次需要手动P协议文件和身份证(脱敏),还要识别证件及图片文件的内容,觉得狠狠狠麻烦,遂就找到了技术总监,技术总监一拍脑袋,额,小邹啊。。。 呃,一开始并没抱太大希望,不过还是花了些心思做了些需求实现的调研,怎么办 google、duckduckgo、github一路找下来就有了几个工程了,嘿嘿~,可惜还没高兴到,没想到的是这些工程一个比一个坑,不是依赖windows系统组件就是代码bug不断,作者们,能用点儿心么 日夜操劳,加班啊,总算是将几个工程全都修得能跑起来了,大费周折。。。难得啊 欸,可惜效果均不佳;现开始,我总结下一些主流的图文识别技术,只是浅聊哦。。。 首先,这些工程大致分两类: 一类是纯算法,不附带机器学习功能的,且需要依赖于window系统组件的工程,比如tesseract和tes...