月之暗面开源 K2 Vendor Verifier,用于评估 API 供应商的调用能力
月之暗面(Moonshot AI)发布了名为 K2 Vendor Verifier(K2VV)的开源项目。该工具旨在帮助开发者直观地评估不同推理服务商在工具调用(tool call)场景下的准确率差异。
月之暗面发现,不同模型 API 供应商提供的服务虽然都使用 Kimi K2 开源模型,但工具调用能力上差异很大。于是他们对此进行了测试并开源了测试工具。
目前,该工具已集成至模型聚合平台 OpenRouter。用户可以通过一个可视化界面实时查看各家提供商的表现,并依据这些数据选择最适合自身业务需求的后端服务。
开源地址:https://github.com/MoonshotAI/K2-Vendor-Verfier
