您现在的位置是:首页 > 文章详情

研究人员用 50 美元云计算资源训练出媲美 o1 的“推理”模型

日期:2025-02-07点击:52

据 TechCruch 报道,李飞飞等斯坦福大学和华盛顿大学研究人员以不到 50 美元的云计算资源训练出具备「推理」能力的人工智能模型。

论文地址:https://arxiv.org/html/2501.19393v1

报道指出,该模型名为 s1,在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。

该模型的团队成员表示,他们从一个现有的基础模型开始,然后通过「蒸馏」对其进行微调。研究人员称,s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。

该模型及用于训练 s1 模型的数据和代码目前可在 GitHub 上获取。

Github:https://github.com/simplescaling/s1

原文链接:https://www.oschina.net/news/332492
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章