软件所开源首个本地通用幻灯片智能体模型与环境系统-低调大师

软件所开源首个本地通用幻灯片智能体模型与环境系统

2026-03-26 114

中国科学院软件研究所中文信息处理实验室近日开源了第二代幻灯片智能体系统 PPTAgent，实现了业界首次将幻灯片智能体模型与完整的智能体沙箱环境一同开源，并支持在单张消费级显卡和 Mac 终端上一键部署，全面适配华为昇腾国产化算力生态。

该工作彻底重构了AI制作幻灯片的逻辑，使智能体不仅能“深度探索”，还能“亲眼所见”。相关研究成果 DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation 已公开发布。

根据介绍，DeepPresenter放弃了传统的“语言模型直接生成”路径，而是将智能体置入一个全功能的Docker沙箱环境（Shared Agent Environment）。在内容生成方面，研究团队构建了包含20余种专业工具的共享智能体环境，集成了基于Docker的智能体沙盒、arXiv实时文献检索，以及Python代码执行与数据可视化等能力，为幻灯片内容的专业性与数据准确性提供保障。

在排版优化方面，研究团队提出了环境感知反思机制（Environment-Grounded Reflection）。该机制通过"生成—渲染—审视—修正"的视觉闭环工作流，使智能体在每页幻灯片生成后，调用沙箱内浏览器将代码渲染为真实图片，并基于截图进行自适应检查与迭代优化，直至排版效果达到预期标准。

在模型训练方面，研究团队设计了系统化的训练流水线：首先，基于PersonaHub与arXiv等多源数据集构建高多样性任务数据，并在指令中定义页数限制、宽高比及语言等细粒度约束条件；其次，引入独立评审机制以克服智能体的自我验证偏差（Self-verification Bias），由独立模型作为外部评估者指出生成产物中的排版或逻辑缺陷；最终，从1152个任务中筛选出802条高质量智能体轨迹用于监督微调训练，涵盖中英双语、多种宽高比及复杂指令约束场景。

为验证所提方法的有效性，研究团队在预留的128个测试任务上使用PPTEval进行了系统评测，并与多种主流幻灯片生成方案进行了对比。结果表明，DeepPresenter（pptagent 2.0）的9B版本取得了 4.19 的综合评分，与闭源模型GPT-5（4.22）表现接近，且显著优于其他幻灯片生成方案。

通过成本—性能分析，DeepPresenter-9B处于前沿曲线的最优平衡点位置，能以远低于闭源模型的算力成本实现同等级别的生成质量。所有生成内容均输出为可编辑的pptx格式，支持用户自由修改与二次创作。

微信关注我们

原文链接：https://www.oschina.net/news/414467

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

横扫 11 项榜单 SOTA：高性能、全尺寸、超高效的多语嵌入模型 F2LLM-v2 来了

在人工智能席卷全球的今天，你是否发现：大多数顶尖的 Embedding（嵌入）模型，在英语和中文环境下表现惊艳，但一旦切换到日语、韩语、德语或是小众语种，表现就大打折扣？你是否也曾在搭建 RAG（检索增强生成）系统时因为可选 Embedding 模型太少，找不到一款适合你算力的模型而发愁？今天，蚂蚁集团 CodeFuse 团队联合上海交通大学给出了答案：F2LLM-v2 系列正式发布！它不仅打破了“英语中心主义”的壁垒，更以全开源的姿态，为全球开发者提供了一套高性能、全尺寸、极致高效的语义表征方案。 🚀 实力霸榜：横扫11项MTEB榜单在衡量 Embedding 模型最权威的 MTEB（Massive Text Embedding Benchmark）评测中，F2LLM-v2 展现了统治级的表现： 11项冠军：在德语、法语、波兰语、日语以及代码等 11 个语种/领域榜单中位列第一。全线碾压：即使是家族中的小个子成员，在同尺寸下也多次击败了 Qwen3-Embedding 和 EmbeddingGemma 等业界大模型。深度覆盖：从代码检索、医疗问答到语义相似度分析，430 ...

2026-03-26

86

GNOME 基金会宣布推出GNOME Fellowship计划，一项旨在资助致力于 GNOME 项目长期可持续发展的社区成员的新举措。首轮奖学金将于 5 月启动，为期 12 个月，资助对象为独立贡献者和社区贡献者。“这种方式可以减少捐助者和基金会的行政负担，让有才华的人能够发挥所长：发现重要问题并解决它们。” 基金会每年将根据申请人的经验和所在地提供 7 万至 10 万美元的资助，凡在 GNOME 领域有建树或相关经验者均可申请，但受美国相关政策限制，申请者需符合特定条件。GNOME 基金会理事会委员会将审核申请，并遴选申请人。 GNOME 一直以来的蓬勃发展，离不开众多贡献者的支持：他们投入时间和专业知识，构建并维护着数百万用户赖以生存的桌面环境、应用程序和平台。然而，开源贡献往往依赖于志愿者在繁忙的工作之余抽出时间，或是企业在众多优先事项中选择资助开发。因此，项目中许多重要的领域——那些不那么引人注目但却至关重要的基础设施工作 —— 往往得不到足够的投入。该奖学金计划改变了这一现状。得益于“GNOME 之友”捐赠者的慷慨支持，我们现在能够直接资助贡献者，让他们专注于对 GNOM...

2026-03-26

122

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。