Zoom 凭借联邦 AI 刷新全球最难 AI 考试纪录
Zoom 的人工智能系统近日在被誉为“人类最后的考试”(Humanity's Last Exam, HLE)的顶级基准测试中,以 48.1% 的成绩刷新了世界纪录,超越了此前由谷歌 Gemini3Pro 保持的45.8%。 面对“一家非底层模型厂商如何反超模型巨头”的质疑,Zoom 首席技术官、前微软 AI 大将黄学东(Xuedong Huang)表示,Zoom 并非通过烧钱训练自己的万亿参数大模型,而是开发了一套精密的“联邦式人工智能方法”: Z 评分器(Z-Scorer):系统的核心大脑,负责实时评估来自 OpenAI、Google 和 Anthropic 等多个模型的响应,挑选出针对特定任务的最优解。 探索-验证-联合策略:这是一套智能体(Agent)工作流,通过让多个人工智能系统进行“辩证协作”,互相挑战并完善推理结果。 流量控制器:简单来说,Zoom 构建了一个极其聪明的人工智能“调度中心”,通过集成而非自研,实现了“超越任何单一模型极限”的性能表现。 这一成绩在开发者社区引发了巨大的分歧。以工程师 Max Rumpf 为代表的批评者认为,Zoom 只是通过 API “套壳”...
