《DeepSeek-V3.1 SQL 能力评测报告》发布
一、本期导览与核心看点 2025 年 8 月,SCALE 评测基准在纳入 GPT-5 家族 后,又马上纳入了 深度求索 公司于 8 月 21 日发布的最新模型 ------ DeepSeek-V3.1。 本报告旨在通过我们标准化的测试集,客观评估该模型在专业级数据库 SQL 任务中的综合能力,并揭示其在企业真实场景下的表现。 评测结果显示,DeepSeek-V3.1 在 "理解、优化、转换" 三方面表现出较为均衡的实力。其在 SQL 优化 维度上表现相对突出,获得了 67.3 分,为需要进行深度代码分析与系统维护的场景提供了有力的支持。 二、评测基准说明 为保证评测的纵向可比性与结果的稳定性,本月测评维度依旧围绕三大维度进行测评:SQL 理解、SQL 优化 与 SQL 方言转换,以确保对所有参评模型进行公平且深入的评估。 三、新增模型深度分析 以下是对 DeepSeek-V3.1 的首次评测表现进行详细剖析。 SQL 理解能力(综合得分:70.2) 细分指标 分数 语法错误检测 81.4 执行准确性 70 执行计划检测 57.1 模型表现分析 优势:模型在 "语法错误检测" 上表现稳健...
