IBM 发布 Granite-Docling-258M:开源企业级文档 AI 模型
IBM 正式发布了 Granite-Docling-258M,这是一个开源的视觉语言模型,专为端到端文档转换而设计。与传统的 OCR(光学字符识别)技术相比,Granite-Docling 注重保持文档的布局信息,能够有效提取表格、代码、公式、列表、标题等元素,并输出结构化的机器可读格式,而非简化的 Markdown 格式。
Granite-Docling 是 SmolDocling-256M 的改进版。IBM 对原有的技术架构进行了优化,采用了 Granite165M 语言模型,并升级了视觉编码器为 SigLIP2,同时保持了 Idefics3风格的连接器。
这一系列更新使得 Granite-Docling 的参数量达到了258M,并在布局分析、全页 OCR、代码、公式及表格的精确度上都有显著提升。此外,IBM 还解决了在预览模型中发现的不稳定性问题,如重复令牌循环现象。
Granite-Docling 采用了基于 Idefics3的架构,使用了 nanoVLM 训练框架。其输出的 DocTags 是 IBM 开发的一种标记语言,能够清晰地表示文档结构,包括元素、坐标和关系,方便后续工具将其转换为 Markdown、HTML 或 JSON 格式。这种结构化的输出方式,不仅保持了表格拓扑、数学公式、代码块及标题的顺序,还提高了数据索引的质量和增强了检索能力。
在多语言支持方面,Granite-Docling 首次增加了对日语、阿拉伯语和中文的实验性支持,但目前以英语为主要目标。IBM 建议用户将 Granite-Docling 与 Docling 集成,利用其 CLI/SDK 自动转换 PDF、办公文档及图片至多种格式。这款模型能够在 Transformers、vLLM、ONNX 和 MLX 等运行环境中流畅运行,特别为 Apple Silicon 进行了优化。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
CodeRabbit 发布面向终端的 AI 代码审查 CLI 工具
AI代码审查初创公司CodeRabbit宣布推出“CodeRabbit CLI”,一款用于终端环境的AI代码审查工具,能与Claude Code、Codex CLI、Cursor CLI、Gemini等AI编码助手无缝协同。 CodeRabbit表示,随着开发者越来越多地通过CLI编码助手编写代码,他们发现了一个关键需求:代码生成速度空前提升,但质量验证往往滞后至PR阶段才进行。 CodeRabbit CLI通过将智能审查直接融入CLI工作流,在代码生成与验证之间建立实时反馈循环,彻底改变了这一现状。 无论您是让Claude Code重构模块,还是使用Cursor CLI实现功能,CodeRabbit都能即时审查输出结果:捕捉幻觉错误、标记安全隐患,甚至将上下文相关的修复方案反馈给AI助手。 CodeRabbit CLI正是缺失的协调层,它使AI生成的代码具备生产就绪能力,将自主开发的美好愿景化为现实。 CodeRabbit CLI可在任意终端后台运行,并能与Claude Code、OpenAI Codex CLI、Cursor CLI、Gemini CLI等主流AI编码CLI无缝集成...
-
下一篇
微软斥资 62 亿美元租赁挪威 AI 计算能力
微软公司日前宣布,将支付62亿美元租赁挪威的人工智能计算能力。这一重大投资是与英国数据中心公司 Nscale Global Holdings Ltd. 及挪威投资公司 Aker ASA 的合作成果。 根据双方的声明,此项目将依托于 “保障的电网容量和完全可再生的电力” 来进行运作。这意味着,微软的 AI 计算将在环保方面做出积极的贡献。 此次合作的背景是在全球对人工智能技术的需求不断增长的情况下,尤其是在数据处理和机器学习等领域。微软希望通过这一投资来提升其在 AI 领域的竞争力,并为客户提供更为强大的计算能力。与 Nscale Global 和 Aker ASA 的合作,将使微软能够利用挪威丰富的可再生能源资源,满足日益增长的计算需求。 挪威以其丰富的水力资源而闻名,能够提供稳定而清洁的电力供应,这对于运行大型数据中心至关重要。在确保电力来源的同时,微软还将关注其碳足迹,力求在推动技术发展的同时,兼顾环保责任。这一项目的成功实施,预计将为全球 AI 产业的发展提供重要支持。 微软在人工智能领域的战略布局不仅仅体现在资金投入上,还包括技术研发、产品创新以及与全球领先公司的合作。通过这一...
相关文章
文章评论
共有0条评论来说两句吧...