docTR —— OCR 文档文本识别库
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以无缝访问光学字符识别
获取预训练模型
使用两阶段方法在 docTR 中实现端到端 OCR:文本检测(定位单词),然后文本识别(识别单词中的所有字符)。因此,可以从可用实现列表中选择用于文本检测的架构和用于文本识别的架构。
from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)
读取文件
可以从 PDF 或图像解释文档:
from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])
以默认的预训练模型为例:
from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc)
安装
安装 docTR 需要 Python 3.6(或更高版本)和 pip。
由于使用了 weasyprint,如果没有运行在 Linux 系统之上,将需要额外的依赖项。
对于 macOS 用户,可以按如下方式安装它们:
brew install cairo pango gdk-pixbuf libffi
对于 Windows 用户,这些依赖项包含在 GTK 中。
最新版本
可以使用 pypi 安装最新版本的软件包,如下所示:
pip install python-doctr

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
每日一博 | 一文掌握 MyBatis 的动态 SQL 使用与原理
摘要:使用动态 SQL 并非一件易事,但借助可用于任何 SQL 映射语句中的强大的动态 SQL 语言,MyBatis 显著地提升了这一特性的易用性。 本文分享自华为云社区《MyBatis详解 - 动态SQL使用与原理》,作者:龙哥手记 。 动态 SQL 是 MyBatis 的强大特性之一。如果你使用过 JDBC 或其它类似的框架,你应该能理解根据不同条件拼接 SQL 语句有多痛苦,例如拼接时要确保不能忘记添加必要的空格,还要注意去掉列表最后一个列名的逗号。利用动态 SQL,可以彻底摆脱这种痛苦。 使用动态 SQL 并非一件易事,但借助可用于任何 SQL 映射语句中的强大的动态 SQL 语言,MyBatis 显著地提升了这一特性的易用性。 如果你之前用过 JSTL 或任何基于类 XML 语言的文本处理器,你对动态 SQL 元素可能会感觉似曾相识。在 MyBatis 之前的版本中,需要花时间了解大量的元素。借助功能强大的基于 OGNL 的表达式,MyBatis 3 替换了之前的大部分元素,大大精简了元素种类,现在要学习的元素种类比原来的一半还要少。 if choose (when, oth...
- 下一篇
AMD 发布 P-State EPP v9 驱动,有望在 Linux 6.3 合并
在错过了 Linux 6.2 内核合并窗口后,AMD 的 P-State EPP (Energy Performance Preference) 驱动现在已迭代到了第九次修订版本;在现有的 P-State 驱动支持基础上,其似乎有望在 Linux 6.3 中成功合并。 AMD Linux 工程师 Perry Yuan 发布了第九版 P-State EPP 驱动程序补丁,旨在提高现有和主线 AMD P-State 驱动程序的性能和 power control。此功能基于 ACPI CPPC EPP knob 构建。 这个补丁集实现了一个新的 AMD CPU 频率驱动程序 amd-pstate-epp 实例,以实现更好的性能和 power control。CPPC 有一个参数叫做 energy preference performance (EPP)。EPP 在 CCLK DPM controller 中用于驱动一个核心在短期活动期间要运行的频率。EPP 值将用于不同的操作系统配置文件 (balanced, performance, power savings)。 AMD Energy P...
相关文章
文章评论
共有0条评论来说两句吧...