OpenDataLab 与钉钉联手推出面向企业用户的文档解析工具 DLU
OpenDataLab 和钉钉基于 MinerU 推出了一款面向企业用户的文档解析工具——DLU(Document Language Understanding)。 MinerU 是上海人工智能实验室(上海 AI 实验室)OpenDataLab 推出的智能文档解析引擎,因精准解析能力及广泛兼容性深受用户青睐,在 GitHub 上已累计获得超 4 万星标。 基于 MinerU 打造的 DLU 将于近期开源,其具备良好的文件格式兼容性,深层次的内容理解与精准的结构化输出能力,不仅支持主流的Office 文档、PDF、Markdown 及代码文件,还涵盖钉钉自有的文档、表格与 AI 表格格式;并支持提取纯文本内容,精准解析图表、公式、插图乃至专业领域的化学分子式等复杂视觉元素,并将其有效转换为适合大模型训练的高质量语料。
