研究人员用 50 美元云计算资源训练出媲美 o1 的“推理”模型-低调大师

研究人员用 50 美元云计算资源训练出媲美 o1 的“推理”模型

2025-02-07 267

据 TechCruch 报道，李飞飞等斯坦福大学和华盛顿大学研究人员以不到 50 美元的云计算资源训练出具备「推理」能力的人工智能模型。

论文地址：https://arxiv.org/html/2501.19393v1

报道指出，该模型名为 s1，在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。

该模型的团队成员表示，他们从一个现有的基础模型开始，然后通过「蒸馏」对其进行微调。研究人员称，s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。

该模型及用于训练 s1 模型的数据和代码目前可在 GitHub 上获取。

Github：https://github.com/simplescaling/s1

微信关注我们

原文链接：https://www.oschina.net/news/332492

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenAI 更新推理模型 o3-mini 思维链

OpenAI 宣布，面向免费和付费用户更新o3-mini的思维链，并为付费用户更新o3-mini-high的思维链。就在一周前，OpenAI上线小型推理模型o3-mini并向免费用户开放，免费版用户可通过消息编辑器选择“推理”模式或重新生成回复来试用o3-mini。这也是ChatGPT首次向免费用户开放其推理模型。

2025-02-07

277

GNU Binutils 2.44 已于日前发布。值得一提的是，公告内容指出：与以往不同的是，本次发布的 binutils-2.44.tar 包不包含 gold linker 的源代码。因为 GNU Gold linker 已被弃用，除非有志愿者愿意继续开发和维护，否则最终将被移除。目前，相关源代码可在 binutils-with-gold-2.44.tar tar 包中找到。今后，奇数版本的 binutils（2.45、2.47 等）将只包含 binutils.2.xx.tar 包，而偶数版本将同时包含 binutils-2.xx.tar 和 binutils-with-gold-2.xx.tar 包，直到其被完全删除。 GNU Gold 由谷歌于二十多年前推出，旨在提高链接性能，使其比 GNU 链接器更快。事实证明，GNU Gold 确实达到了预期目的，并证明了更快地链接 ELF 对象是可能的。但随着谷歌更依赖于性能更优的 LLVM 工具链，GNU Gold 缺乏投资且开发活动逐渐停滞。科技网站 Phoronix 指出，随着越来越多的企业组织转而使用 LLVM 工具链，以及那些...

2025-02-07

266

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。