微软提出“Agent 优化循环”，将 Agent 质量改进定义为搜索问题-低调大师

微软提出“Agent 优化循环”，将 Agent 质量改进定义为搜索问题

2026-06-03 42

微软工程师在实践中发现了一个困扰许多团队的问题：AI Agent的质量改进陷入了"测量容易修复难"的困境。当团队能够追踪和评估Agent的表现时，却发现即使知道问题所在，也很难在不引入回归的情况下完成修复。针对这个挑战，微软Vivek Bhaduria、Luis Quintanilla和Saket Sathe组成的团队提出了一个新的解决思路——将Agent质量改进重新定义为一个搜索问题，而非传统意义上的调试。

这个解决方案被称为"Agent优化循环"，包含四个核心步骤。第一步是生成候选修改方案，团队使用一个专门的"反思者"模型来分析失败的追踪记录，并提出有针对性的修改建议。第二步是对所有候选方案进行评分和排序，确保它们在同一个评估标准和基线版本上进行对比。第三步是开发者审核，这是一个必要的人工把关环节，确保自动生成的修改方案在进入生产环境前经过人类确认。第四步是部署获胜方案，由于采用了版本化管理，任何修改都可以回滚。

这个系统的核心理念在于反思模型的质量比执行Agent的模型本身影响更大。团队在实践中发现，一个更好的诊断模型所带来的产出质量提升，远远超过提升执行模型本身。这引出了一个重要原则：更好的诊断胜过更好的执行。这个洞察直接影响了整个系统的设计思路——与其在执行端堆砌更强大的模型，不如在诊断端投入更多资源。

从工程实现角度看，这套系统已经被打包成Microsoft Foundry Agent Service中的Agent Optimizer功能，通过azd CLI对外提供。开发者可以使用azd ai agent eval init初始化评估流程，用azd ai agent eval run运行测试，用azd ai agent optimize启动优化，用azd ai agent optimize apply --candidate <id>应用候选修改，最后用azd deploy完成部署。整个流程与传统的CI/CD pipeline高度一致，团队可以像管理代码版本一样管理Agent配置。

不过这个工具也有明确的适用边界。它最适合处理跨领域的质量问题、大规模运营中的系统性配置失败（包括指令、技能、工具和模型的配置问题），而不是早期开发阶段、基础设施问题、单点失败模式，或者需要通过升级模型来解决的任务。团队也特别强调了"自动化without oversight会放大错误"这一警示——人工审核环节是不可或缺的。

参考来源：https://commandline.microsoft.com/the-agent-optimization-loop-and-how-we-built-it-in-foundry/

微信关注我们

原文链接：https://www.oschina.net/news/451536

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

微软发布 Project Solara，面向 AI Agent 时代的硬件平台

微软在Build 2026期间正式公布了代号为"Project Solara"的芯片到云端平台，这是一个专为AI Agent优先体验设计的全新硬件+软件整合方案。微软Windows与设备副总裁Steven Bathiche在博客中表示，AI Agent正在成为新的编程单元和人机交互单元，Project Solara的使命是推动新类型计算设备的出现。 Project Solara的架构围绕三大核心支柱展开：企业就绪（隐私、安全、控制、信任）、Agent驱动的交互模型（即时UI，Just-in-time UI）、以及可扩展性（支持自带Agent BYOA）。在设备端，微软推出了...

2026-06-03

34

代码审查是软件工程中最重要的质量保障手段之一，但当面对一个包含数百个文件、数万行代码变更的大型PR时，即便是最有经验的审查者也容易迷失。传统的Git工作流在处理这类场景时往往力不从心——你需要记住哪些文件看过了、哪些还没看、哪些意见已经解决了。这份"心理清单"本身就是一种认知负担。Ben Gesoff最近分享了一套基于Jujutsu的工作流，尝试用工具来解决这个问题。 Jujutsu是一个新兴的版本控制系统，被设计为Git的替代者。它的核心设计理念是利用不可变的事务和自动追踪的变更图来消除传统Git操作中的很多陷阱。在代码审查这个具体场景上，Juju...

2026-06-03

43

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。