Meta 推出 SPICE 框架，让 AI 系统自我学习推理能力-低调大师

Meta 推出 SPICE 框架，让 AI 系统自我学习推理能力

2025-11-12 150

Meta 的人工智能研究团队与新加坡国立大学合作开发了一种名为 “自我对弈环境中的自我提升”（SPICE）的新型强化学习框架。该框架通过让两个 AI 代理相互对抗，创造自我提升的挑战，使其在没有人类监督的情况下逐渐提高能力。目前，这一框架仍处于概念验证阶段，但有望为未来能够动态适应环境的 AI 系统奠定基础，从而在面对现实世界的不可预测性时更加稳健。

自我提升 AI 的目标是让系统通过与环境的互动来增强自身能力。传统方法通常依赖于人类策划的问题集和奖励机制，这使得扩展变得困难。而自我对弈的方式让模型通过相互竞争来实现提升。然而，现有自我对弈方法在语言模型上的应用受到一些限制，如生成问题和答案中的事实错误相互叠加，导致 “幻觉” 现象。此外，当问题生成者和解答者共享相同知识库时，无法生成新挑战，容易陷入重复模式。

SPICE 框架采用一种创新的自我对弈机制，其中一个模型承担两个角色:“挑战者” 构建来自大量文档的困难问题，而 “推理者” 则尝试在没有访问源文档的情况下解决这些问题。这种设置打破了信息对称，使得推理者无法使用挑战者用来生成问题的知识，进而减少错误的发生。

这种对抗性动态创造了一个自动化的课程，挑战者会因生成多样且恰好位于推理者能力边界的难题而获奖，而推理者则因正确回答而获奖。这种互惠的互动促进了两个角色的共同成长，推动他们不断发现并克服新的挑战。由于该系统利用的是原始文档，而非预定义的问题 - 答案对，因而可以生成多种任务格式，适用于不同领域，打破了以往方法在特定领域的局限。

研究人员对多个基础模型进行评估，发现 SPICE 在数学和一般推理任务中表现出色，超过了其他基线模型。这一发现表明，通过基于语料库的自我对弈所培养的推理能力能够有效迁移到不同模型上，预示着自我提升推理方法的新时代。

微信关注我们

原文链接：https://www.oschina.net/news/383045

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

开发者对 AI 代码依赖度不足，仅 9% 信任无监督使用

BairesDev 发布的《开发者晴雨表》报告显示，随着人工智能在软件开发中的日益普及，开发者的工作模式正在经历重大转变。此次调查对501名开发者和19名项目经理进行了问卷，结果表明，近65% 的高级开发者预计到2026年，他们的角色将因 AI 的应用而重新定义。报告指出，越来越多的开发者预计将从手动编码转向解决方案设计，74% 的受访者表示他们会更多地关注设计而非编码。此外，61% 的人计划在工作流程中集成 AI 生成的代码，50% 的受访者则预计会花更多时间在系统战略和架构方面。尽管对 AI 的应用充满期待，开发者们仍对其可靠性表示谨慎。调查显示，56% 的开发者认为 AI 生成的代码 “相对可靠”，但仍需进行准确性和安全性的验证，只有9% 的受访者愿意在没有人工监督的情况下使用这些代码。 BairesDev 首席技术官 Justice Erolin 在接受采访时提到，AI 可以帮助开发者节省每周大约8小时的时间，这些时间将用于解决方案架构和战略工作。他强调，AI 并不能替代人类的监督，开发者需要理解如何将各个组件融入更大的系统中。报告还指出，预计到2026年，开发团队将更加...

2025-11-12

141

据 TechCrunch报道，Meta首席AI科学家、图灵奖得主杨立昆（Yann LeCun）计划未来数月离职，创办专注于世界模型研究的初创公司，目前已启动融资洽谈。杨立昆同时担任纽约大学教授，其研究的世界模型可通过模拟因果场景预测结果，多家顶尖机构均在该领域布局。杨立昆的离职恰逢Meta AI战略调整期。为追赶OpenAI等对手，Meta已重组AI部门，成立超级智能实验室（MSL），从竞品挖角50余名研发人员，并以143亿美元投资Scale AI并聘请其CEO领导新部门。由于Llama 4模型表现不及竞品，Meta转向短期产品落地，杨立昆主导的长期基础研究实验室（FAIR）受关注度下降。杨立昆长期公开质疑大语言模型（LLM）的过度营销，认为AI距高级智能仍有较大差距。Meta尚未就此回应。

2025-11-12

128

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。