Mistral AI 发布 Agents API，内置代码执行、网络搜索等工具-低调大师

Mistral AI 发布 Agents API，内置代码执行、网络搜索等工具

2025-05-28 285

Mistral AI 宣布推出 Agents API，其内置代码执行、网络搜索等工具，支持跨对话持久记忆和智能体编排。

传统语言模型擅长生成文本，但在执行操作或保持上下文方面存在局限。Mistral 的新 Agents API 通过将 Mistral 强大的语言模型与以下功能结合，解决了这些局限性：

内置的代码执行、网络搜索、图像生成和 MCP 工具连接器

跨对话的持久化记忆

针对代理的编排能力

Agents API 通过提供一个专门的框架补充了 Chat Completion API，简化了代理用例的实现。它是企业级 Agent 平台的核心。

通过为 AI Agent 提供一个可靠的框架来处理复杂任务、保持上下文和协调多个操作，Agents API 使企业能够以更实用和更有影响力的方式使用 AI。

Mistral Agents API 主要功能如下：

核心功能组件

代码执行连接器支持在安全沙盒中运行 Python 代码，图像生成连接器由Black Forest Lab FLUX1.1 [pro] Ultra驱动，文档库连接器集成 RAG 功能，网络搜索连接器可获取 AFP 和 AP 等新闻机构的最新信息。

性能提升数据

启用网络搜索后，Mistral Large和Mistral Medium在 SimpleQA 基准测试中的准确率分别从 23% 和 22.08% 提升至 75% 和 82.32%。

智能体编排能力

通过模型上下文协议（MCP）实现动态任务分配，例如财务智能体可委托网络搜索智能体获取数据，再交由计算器智能体处理。系统支持流式输出和对话状态管理，开发者无需手动维护上下文。

应用场景示例

包括 GitHub 编码助手（DevStral 驱动）、Linear 票务系统集成、金融分析工作流、AI 旅行规划师和饮食伴侣等企业级解决方案。

微信关注我们

原文链接：https://www.oschina.net/news/352303/mistral-ai-agents-api

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

多模态大模型视觉推理能力评估：o3 仅得 25.8% 分数

清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队近日联合发布了一项新评估基准 ——RBench-V，专门针对多模态大模型的视觉推理能力进行测试。 RBench-V 基准测试包含803道题目，涉及多个领域，包括几何与图论、力学与电磁学、多目标识别和路径规划等。与以往只要求文字回答的评估不同，这次评测特别要求模型生成或修改图像内容，以支持推理过程。这意味着，模型不仅需要理解问题，还需要像人类一样，通过绘制辅助线或观察图形结构来进行思考。测试结果显示，即便是表现最好的 o3模型，在 RBench-V 上的准确率也仅为25.8%，远低于人类专家的82.3%。Google 的 Gemini2.5模型紧随其后，仅获得20.2% 的得分。更令人担忧的是，许多开源模型的准确率在8% 至10% 之间，甚至有些模型的表现接近随机作答。 RBench-V 的研究表明，当前的多模态大模型在处理复杂的几何问题时，往往采取了简化的策略。与人类通过直观的可视化方法进行思考不同，大部分模型更倾向于将图形问题抽象为代数表达，用文本推理代替真实的图像操作。这一现象反映出它们在深层理解图像信息上的不足。研究团队...

2025-05-28

295

Anthropic宣布为其 Claude 聊天机器人上线语音模式 (voice mode)，作为 Beta 版在 iOS 和 Android 移动应用上逐步向英语用户推出，计划在未来几周内覆盖所有订阅计划。这一功能由 Claude Sonnet 4 模型驱动，旨在提供更自然的交互体验，允许用户通过语音与 Claude 进行完整对话，尤其适合双手繁忙的场景，如驾驶或多任务处理。 Claude 的语音模式支持五种不同语音选项（包括 Airy、Mellow、Buttery 等），并能在对话中显示关键要点、生成对话转录和摘要，用户可随时切换文本和语音交互，增强使用灵活性。该模式不仅支持日常对话，还能处理文档和图片讨论，集成 Google Workspace 功能（仅限付费订阅用户），允许 Claude 访问 Gmail、Google 日历和 Google 文档，执行如总结日程或搜索文档等任务。例如，用户可要求 Claude 分析日历并生成会议报告。 Anthropic 首席产品官 Mike Krieger 在《金融时报》采访中表示，语音模式是 Claude 向更自然用户界面的演进，特别适合...

2025-05-28

474

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。