docTR —— OCR 文档文本识别库-低调大师

docTR —— OCR 文档文本识别库

2022-12-27 691

由 TensorFlow 2 和 PyTorch 提供支持，任何人都可以无缝访问光学字符识别

获取预训练模型

使用两阶段方法在 docTR 中实现端到端 OCR：文本检测（定位单词），然后文本识别（识别单词中的所有字符）。因此，可以从可用实现列表中选择用于文本检测的架构和用于文本识别的架构。

from doctr.models import ocr_predictor

model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)

读取文件

可以从 PDF 或图像解释文档：

from doctr.io import DocumentFile
# PDF
pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images()
# Image
single_img_doc = DocumentFile.from_images("path/to/your/img.jpg")
# Webpage
webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images()
# Multiple page images
multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])

以默认的预训练模型为例：

from doctr.io import DocumentFile
from doctr.models import ocr_predictor

model = ocr_predictor(pretrained=True)
# PDF
doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images()
# Analyze
result = model(doc)

安装

安装 docTR 需要 Python 3.6（或更高版本）和 pip。

由于使用了 weasyprint，如果没有运行在 Linux 系统之上，将需要额外的依赖项。

对于 macOS 用户，可以按如下方式安装它们：

brew install cairo pango gdk-pixbuf libffi

对于 Windows 用户，这些依赖项包含在 GTK 中。

每日一博 | 一文掌握 MyBatis 的动态 SQL 使用与原理

摘要：使用动态 SQL 并非一件易事，但借助可用于任何 SQL 映射语句中的强大的动态 SQL 语言，MyBatis 显著地提升了这一特性的易用性。本文分享自华为云社区《MyBatis详解 - 动态SQL使用与原理》，作者：龙哥手记。动态 SQL 是 MyBatis 的强大特性之一。如果你使用过 JDBC 或其它类似的框架，你应该能理解根据不同条件拼接 SQL 语句有多痛苦，例如拼接时要确保不能忘记添加必要的空格，还要注意去掉列表最后一个列名的逗号。利用动态 SQL，可以彻底摆脱这种痛苦。使用动态 SQL 并非一件易事，但借助可用于任何 SQL 映射语句中的强大的动态 SQL 语言，MyBatis 显著地提升了这一特性的易用性。如果你之前用过 JSTL 或任何基于类 XML 语言的文本处理器，你对动态 SQL 元素可能会感觉似曾相识。在 MyBatis 之前的版本中，需要花时间了解大量的元素。借助功能强大的基于 OGNL 的表达式，MyBatis 3 替换了之前的大部分元素，大大精简了元素种类，现在要学习的元素种类比原来的一半还要少。 if choose (when, oth...

2022-12-27

514

在错过了 Linux 6.2 内核合并窗口后，AMD 的 P-State EPP (Energy Performance Preference) 驱动现在已迭代到了第九次修订版本；在现有的 P-State 驱动支持基础上，其似乎有望在 Linux 6.3 中成功合并。 AMD Linux 工程师 Perry Yuan 发布了第九版 P-State EPP 驱动程序补丁，旨在提高现有和主线 AMD P-State 驱动程序的性能和 power control。此功能基于 ACPI CPPC EPP knob 构建。这个补丁集实现了一个新的 AMD CPU 频率驱动程序 amd-pstate-epp 实例，以实现更好的性能和 power control。CPPC 有一个参数叫做 energy preference performance (EPP)。EPP 在 CCLK DPM controller 中用于驱动一个核心在短期活动期间要运行的频率。EPP 值将用于不同的操作系统配置文件 (balanced, performance, power savings)。 AMD Energy P...

2022-12-27

482

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。