您现在的位置是:首页 > 文章详情

docTR 0.6.0 发布,OCR 文档文本识别库

日期:2023-06-28点击:548

docTR 是一个无缝、高性能且可访问的库,用于由深度学习支持的 OCR 相关任务。

docTR 0.6.0 发布了,doctr 0.6.0 需要 TensorFlow >= 2.9.0 或 PyTorch >= 1.8.0。

版本亮点:

与 Huggingface Hub 完全集成

  • 从 Hub 加载:
 from doctr.io import DocumentFile from doctr.models import ocr_predictor, from_hub image = DocumentFile.from_images(['data/example.jpg']) # Load a custom detection model from huggingface hub det_model = from_hub('Felix92/doctr-torch-db-mobilenet-v3-large') # Load a custom recognition model from huggingface hub reco_model = from_hub('Felix92/doctr-torch-crnn-mobilenet-v3-large-french') # You can easily plug in this models to the OCR predictor predictor = ocr_predictor(det_arch=det_model, reco_arch=reco_model) result = predictor(image)
  • 推送到 Hub:
 from doctr.models import recognition, login_to_hub, push_to_hf_hub login_to_hub() my_awesome_model = recognition.crnn_mobilenet_v3_large(pretrained=True) push_to_hf_hub(my_awesome_model, model_name='doctr-crnn-mobilenet-v3-large-french-v1', task='recognition', arch='crnn_mobilenet_v3_large')

文档:https://mindee.github.io/doctr/using_doctr/sharing_models.html

新模型(两个框架)

  • 分类:VisionTransformer(ViT)
  • 识别:用于场景文本识别的 Vision Transformer (ViTSTR)

错误修复识别模型

  • MASTER 和 SAR 架构现在可在两个框架(TensorFlow 和 PyTorch)中运行

 

更新公告:https://github.com/mindee/doctr/releases/tag/v0.6.0

原文链接:https://www.oschina.net/news/247115/doctr-0-6-0-released
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章