Mistral AI 发布 Agents API,内置代码执行、网络搜索等工具
Mistral AI 宣布推出 Agents API,其内置代码执行、网络搜索等工具,支持跨对话持久记忆和智能体编排。
传统语言模型擅长生成文本,但在执行操作或保持上下文方面存在局限。Mistral 的新 Agents API 通过将 Mistral 强大的语言模型与以下功能结合,解决了这些局限性:
内置的代码执行、网络搜索、图像生成和 MCP 工具连接器
跨对话的持久化记忆
针对代理的编排能力
Agents API 通过提供一个专门的框架补充了 Chat Completion API,简化了代理用例的实现。它是企业级 Agent 平台的核心。
通过为 AI Agent 提供一个可靠的框架来处理复杂任务、保持上下文和协调多个操作,Agents API 使企业能够以更实用和更有影响力的方式使用 AI。
Mistral Agents API 主要功能如下:
核心功能组件
代码执行连接器支持在安全沙盒中运行 Python 代码,图像生成连接器由Black Forest Lab FLUX1.1 [pro] Ultra
驱动,文档库连接器集成 RAG 功能,网络搜索连接器可获取 AFP 和 AP 等新闻机构的最新信息。
性能提升数据
启用网络搜索后,Mistral Large
和Mistral Medium
在 SimpleQA 基准测试中的准确率分别从 23% 和 22.08% 提升至 75% 和 82.32%。
智能体编排能力
通过模型上下文协议(MCP)实现动态任务分配,例如财务智能体可委托网络搜索智能体获取数据,再交由计算器智能体处理。系统支持流式输出和对话状态管理,开发者无需手动维护上下文。
应用场景示例
包括 GitHub 编码助手(DevStral 驱动)、Linear 票务系统集成、金融分析工作流、AI 旅行规划师和饮食伴侣等企业级解决方案。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数
清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队近日联合发布了一项新评估基准 ——RBench-V,专门针对多模态大模型的视觉推理能力进行测试。 RBench-V 基准测试包含803道题目,涉及多个领域,包括几何与图论、力学与电磁学、多目标识别和路径规划等。与以往只要求文字回答的评估不同,这次评测特别要求模型生成或修改图像内容,以支持推理过程。这意味着,模型不仅需要理解问题,还需要像人类一样,通过绘制辅助线或观察图形结构来进行思考。 测试结果显示,即便是表现最好的 o3模型,在 RBench-V 上的准确率也仅为25.8%,远低于人类专家的82.3%。Google 的 Gemini2.5模型紧随其后,仅获得20.2% 的得分。更令人担忧的是,许多开源模型的准确率在8% 至10% 之间,甚至有些模型的表现接近随机作答。 RBench-V 的研究表明,当前的多模态大模型在处理复杂的几何问题时,往往采取了简化的策略。与人类通过直观的可视化方法进行思考不同,大部分模型更倾向于将图形问题抽象为代数表达,用文本推理代替真实的图像操作。这一现象反映出它们在深层理解图像信息上的不足。 研究团队...
- 下一篇
Claude 移动端版本已上线“语音模式”
Anthropic宣布为其 Claude 聊天机器人上线语音模式 (voice mode),作为 Beta 版在 iOS 和 Android 移动应用上逐步向英语用户推出,计划在未来几周内覆盖所有订阅计划。 这一功能由 Claude Sonnet 4 模型驱动,旨在提供更自然的交互体验,允许用户通过语音与 Claude 进行完整对话,尤其适合双手繁忙的场景,如驾驶或多任务处理。 Claude 的语音模式支持五种不同语音选项(包括 Airy、Mellow、Buttery 等),并能在对话中显示关键要点、生成对话转录和摘要,用户可随时切换文本和语音交互,增强使用灵活性。 该模式不仅支持日常对话,还能处理文档和图片讨论,集成 Google Workspace 功能(仅限付费订阅用户),允许 Claude 访问 Gmail、Google 日历和 Google 文档,执行如总结日程或搜索文档等任务。例如,用户可要求 Claude 分析日历并生成会议报告。 Anthropic 首席产品官 Mike Krieger 在《金融时报》采访中表示,语音模式是 Claude 向更自然用户界面的演进,特别适合...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- CentOS7安装Docker,走上虚拟化容器引擎之路