docTR —— OCR 文档文本识别库
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以无缝访问光学字符识别 获取预训练模型 使用两阶段方法在 docTR 中实现端到端 OCR:文本检测(定位单词),然后文本识别(识别单词中的所有字符)。因此,可以从可用实现列表中选择用于文本检测的架构和用于文本识别的架构。 from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True) 读取文件 可以从 PDF 或图像解释文档: from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpa...
