研究人员用 50 美元云计算资源训练出媲美 o1 的“推理”模型
据 TechCruch 报道,李飞飞等斯坦福大学和华盛顿大学研究人员以不到 50 美元的云计算资源训练出具备「推理」能力的人工智能模型。
报道指出,该模型名为 s1,在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。
该模型的团队成员表示,他们从一个现有的基础模型开始,然后通过「蒸馏」对其进行微调。研究人员称,s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。
该模型及用于训练 s1 模型的数据和代码目前可在 GitHub 上获取。
