阶跃星辰开源 Step-DeepResearch,经济高效的端到端深度研究模型
阶跃星辰开源了参数规模为320亿(32B)的深度研究模型:Step-DeepResearch,其在深度研究能力上媲美OpenAI o3-mini和Gemini 2.0 Flash等顶级商业模型,但部署成本降低至不足十分之一(单次调用成本<0.5元人民币)。 https://github.com/stepfun-ai/StepDeepResearch 模型概述 Step-DeepResearch是一款经济高效的端到端深度研究Agent模型,专为开放式研究场景中的自主信息探索和专业报告生成而设计。 原子能力集成:通过将复杂的研究任务分解为可训练的原子能力(包括规划、信息检索、反思和交叉验证以及专业报告生成),并在模型层面实现深度内化,该系统确保在单次推理过程中实现闭环反思和动态校正。 渐进式训练流程:我们建立了一条完整的优化路径,从智能体中期训练到监督式微调(SFT)和强化学习(RL),将训练目标从“预测下一个词元”重塑为“决定下一个原子动作”。这种方法有效地增强了模型在复杂环境中的自适应能力和泛化性能。 跨模型规模的卓越表现:Step-DeepResearch 仅拥有 320 亿个...




