.NET GcPDF V8.2 新版本:人工智能 PDF 处理
一、GcPDF 产品简介
GcPDF(GrapeCity Documents for PDF)是葡萄城(GrapeCity)推出的一款功能强大的 .NET PDF 开发组件,旨在为开发人员提供高效、灵活的 PDF 文档处理解决方案。无论是创建全新 PDF 文档、编辑现有 PDF 内容,还是进行 PDF 转换、批注、签名、表单处理等操作,GcPDF 均能通过简洁易用的 API 实现,广泛适用于企业级报表生成、文档管理系统、电子合同签署、金融票据处理等各类业务场景。
作为 .NET 生态下的成熟 PDF 组件,GcPDF 具备跨平台特性,支持 .NET Framework、.NET Core、.NET 5+ 及以上版本,可在 Windows、Linux、macOS 等操作系统中稳定运行,同时兼顾高性能与低内存占用,能轻松应对大规模 PDF 文档的批量处理需求,帮助开发团队快速构建专业的 PDF 相关应用。
二、GcPDF V8.2 新特性:AI 驱动的 PDF 处理
V8.2 版本新增了功能强大的软件包 GcPDF AI ,该软件包旨在展示 GcPDF 如何与 AI 服务集成,进而优化 PDF 文档工作流程。借助此特性,开发人员可利用 OpenAI 或 Azure OpenAI 直接从 PDF 中生成摘要、创建大纲树,并提取结构化表格数据。
支持的场景
目前,GcPDFAI 支持以下三种由 AI 驱动的 PDF 处理功能:
-
生成文档摘要 - 快速生成任意 PDF 文档的简短或详细摘要。
-
可在 C# 或 VB 语言中通过编程方式,利用 GcPDFAI 生成 PDF 文档摘要。
-
构建文档大纲树 - 自动生成结构化目录,并包含嵌套大纲层级。
-
借助 .NET PDF API 中集成的 AI 功能,自动生成结构化目录。
-
从文档中提取表格 - 通过自然语言提示,从 PDF 中识别并提取表格数据。
-
利用 PDF API 的 AI 功能从 PDF 中提取表格。
上述功能均基于 OpenAI Chat API 构建,支持通过两种方式连接:一是通过官方 OpenAI .NET 客户端库,二是通过 Azure OpenAI 服务。
API 概述
该新软件包包含两个主要类,二者均继承自同一个用于实现核心功能的基类:
- OpenAIDocumentAssistant:通过官方 .NET 客户端库连接至 OpenAI REST API。
- AzureOpenAIDocumentAssistant:通过 Azure.AI.OpenAI 软件包连接至 Azure OpenAI 服务。
这两个类均派生自 OpenAIDocumentAssistantBase 基类,该基类实现了两项关键逻辑:一是通过 Page.GetText() 方法提取文本,二是将内容发送至 AI 服务进行处理。其中,pageRange 参数允许开发人员将请求范围限定在 PDF 的特定章节。
以下代码示例展示了如何在 GcPDF 中实现人工智能驱动的功能:
支持的平台
- OpenAI REST API(通过官方 .NET 客户端连接)
- Azure OpenAI 服务(通过 Azure.AI.OpenAI 软件包连接)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Java GcExcel V8.2 新版本:效率升级与功能突破
作为葡萄城旗下专注于 Excel 文档开发的核心组件,GcExcel 一直以"高效、灵活、兼容"为目标,为 NET 与 Java 开发者提供专业的 Excel 文档处理能力。 GcExcel Java 是一款基于 Java 平台,支持批量创建、编辑、打印、导入/导出Excel文件的服务端表格组件,能够高性能处理和高度兼容 Excel。GcExcel 可助您快速高效地处理 Java 平台中各类 Excel 表格业务需求,从而提高您的开发效率和产品质量,实现更高的商业价值。 GcExcel 可与纯前端表格控件 SpreadJS 前后端兼容,为您开发的应用程序提供在线文档的前后端数据同步、在线填报与服务端批量导出与打印,以及类 Excel 报表模板设计与服务端高性能处理等一整套类 Excel 全栈解决方案。 近日发布的 GcExcel V8.2 版本,更是围绕"性能优化""功能增强""易用性提升"三大核心方向,推出了公式进阶支持、图表适配、无障碍优化等十余个实用特性。本文将针对开发者的实际需求,逐一拆解这些新功能的技术价值与应用场景,帮助大家快速掌握版本亮点。 一、性能跨越式提升:大文件、复...
-
下一篇
Elasticsearch:默认更轻量 - 从 source 中排除向量
作者:来自 ElasticJim Ferenczi Elasticsearch现在默认从 source 中排除向量,在需要时仍可访问向量,同时节省空间并提升性能。 使用这种针对 Search AI 的自定进度动手学习,亲自尝试矢量搜索。您可以立即开始免费的云试用或在本地计算机上试用 Elastic。 我们正在更新 Elasticsearch 存储向量字段的方式,比如 dense_vector、sparse_vector 和 rank_vector。现在,在 Serverless 中,以及即将到来的 v9.2 版本里,新建索引时向量字段将默认从 _source 中排除 。 这一变化开箱即用地减少存储开销、提升索引性能,并使 Elasticsearch 的行为符合用户对现代向量搜索 引擎的期望。 为什么要更改默认设置? 到目前为止,Elasticsearch 会同时把向量存储在 doc_values(用于相似度搜索)和 _source(用于检索)中。然而,大多数向量工作负载在搜索响应里并不需要原始向量,只需要 top-k 结果和少量元数据字段。 把大型向量存两份是浪费的。这会增加索引大小、...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL数据库在高并发下的优化方案
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8编译安装MySQL8.0.19
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS7,8上快速安装Gitea,搭建Git服务器
- 2048小游戏-低调大师作品