您现在的位置是:首页 > 文章详情

Tesseract 5.0 发布,开源 OCR 引擎

日期:2021-12-03点击:1601

Tesseract 是一个最初由惠普公司开发的 OCR 引擎,并于 2005 年开源,Google 在第二年接管了项目的大部分开发工作。

Tesseract 5.0 发布,更新内容如下:

  • 原生支持 Apple Silicon
  • 默认情况下,训练和识别速度更快;
  • 更多的二值化选项
  • 改进了对 ARM NEON 的支持
  • 现代化的代码
  • 从公共 API 中删除了专有数据类型,如 GenericVector 和 STRING
  • 不再需要 pdf.ttf,现在集成到了代码中
  • 使用 automake 更快地进行平面构建
  • combine_tessdata 的新选项可以显示 traineddata 文件的细节
  • 改进了训练信息
  • 改进了单元测试和模糊测试
  • 大量的错误修正

更多详情可查看:https://github.com/tesseract-ocr/tesseract/releases/tag/5.0.0

 

原文链接:https://www.oschina.net/news/171971/tesseract-5-0-released
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章