您现在的位置是:首页 > 文章详情

docTR —— OCR 文档文本识别库

日期:2022-12-27点击:394

由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以无缝访问光学字符识别

OCR_example

获取预训练模型

使用两阶段方法在 docTR 中实现端到端 OCR:文本检测(定位单词),然后文本识别(识别单词中的所有字符)。因此,可以从可用实现列表中选择用于文本检测的架构和用于文本识别的架构。

 from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True) 

读取文件

可以从 PDF 或图像解释文档:

 from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"]) 

以默认的预训练模型为例:

 from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc) 

安装

安装 docTR 需要 Python 3.6(或更高版本)和 pip

由于使用了 weasyprint,如果没有运行在 Linux 系统之上,将需要额外的依赖项。

对于 macOS 用户,可以按如下方式安装它们:

 brew install cairo pango gdk-pixbuf libffi 

对于 Windows 用户,这些依赖项包含在 GTK 中。

最新版本

可以使用 pypi 安装最新版本的软件包,如下所示:

 pip install python-doctr 
原文链接:https://www.oschina.net/p/doctr
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章