MiniMax M2.7: 开启模型的自我进化
MiniMax 公司宣布推出 MiniMax M2.7大模型。据称与以往依靠人类工程师迭代模型不同,M2.7 能够深度参与自身的迭代过程,驱动模型的自我进化。 具体实践是构建了一个“研究型 Agent 框架”,让模型(作为 Agent)能够与研究员协作,承担从文献调研、实验配置、代码修复到监控分析等大量研发工作,可以胜任 30-50% 的工作流,显著加速实验迭代。 更进一步,模型能够自主优化其自身的运行系统(如 Agent Harness),例如通过执行“分析-规划-修改-评测”的循环超过100轮,最终在内部评测集上实现了30%的性能提升。 核心能力表现 软件工程:在真实世界的软件工程项目中表现优异。 故障调试:具备综合推理能力,可关联监控、分析日志、定位数据库问题,甚至在紧急情况下做出SRE级别的决策(如建议“非阻塞建索引”先止血),可将线上故障恢复时间缩短到3分钟内。 编程基准:在 SWE-Pro 中得分为 56.22%,接近当时顶级模型 Opus 的最佳水平。在 VIBE-Pro(端到端项目交付)和 Terminal Bench 2(复杂系统理解)中也取得了接近 Opus 4.6...
