2025 年 9 月《大模型 SQL 能力排行榜》发布,新增 Kimi K2 最新版测评
一、本月导览与核心看点 2025 年 9 月,SCALE 评测基准持续聚焦 AI 在 SQL 领域的应用前沿。本月,榜单新增了 Moonshot AI(月之暗面) 发布的最新模型 ------ Kimi-K2-Instruct-0905,还在平台功能上进行了升级,旨在为开发者、研究者和企业决策者提供更精细、更具洞察力的技术参考。 本期核心看点: 新增模型评测 :新增的 Kimi K2 模型在「SQL 理解 」维度获得 70.4 分,「SQL 优化 」维度获得 64.4 分,「方言转换 」维度获得 63.0分。评测结果显示,该模型在国产数据库适配和基础语法处理方面表现突出,但在处理超长复杂查询和深度优化方面与领先模型存在差距。 平台功能升级 :新增 模型细分指标排名 与 模型对比 功能。用户现可查看各模型在 「逻辑等价 」、「执行准确性」 等细分能力上的排名,并支持对多个模型进行多维度的可视化对比分析,进一步提升了评测数据的透明度与实用性。 二、评测基准说明 为保证评测结果的长期可比性和权威性,本月我们的核心评测基准与算法保持不变。我们继续沿用 SCALE 自创立之初便确立的三维评测体系...