微博推出 VibeThinker-1.5B，低成本 AI 模型挑战大型语言模型-低调大师

微博推出 VibeThinker-1.5B，低成本 AI 模型挑战大型语言模型

2025-11-13 125

微博的人工智能部门推出了开源的 VibeThinker-1.5B，这是一个拥有15亿参数的大型语言模型（LLM），基于阿里巴巴的 Qwen2.5-Math-1.5B 进行的精细调整。

尽管 VibeThinker-1.5B 体积小，但在数学和代码任务上表现出色，达到了行业领先的推理性能，甚至超越了体量达6710亿参数的竞争对手 DeepSeek 的 R1模型。该模型还与 Mistral AI 的 Magistral Medium、Anthropic 的 Claude Opus4和 OpenAI 的 gpt-oss-20B Medium 等多个大型模型抗衡，同时所需的基础设施和投资成本却少得多。

值得一提的是，VibeThinker-1.5B 在后期训练中仅花费了7800美元的计算资源，这一成本远低于同类或更大规模模型所需的数十万美元甚至数百万美元。LLM 的训练分为两个阶段，首先是预训练，模型通过大量文本数据学习语言结构和一般知识。之后的后期训练则使用更小的高质量数据集，使模型能够更好地理解如何提供帮助、进行推理和与人类期望对齐。

VibeThinker-1.5B 采用了一种名为 “谱 - 信号原则”（Spectrum-to-Signal Principle，SSP）的训练框架，该框架将监督微调和强化学习分为两个阶段。第一个阶段注重多样性，第二个阶段则通过强化学习优化最优路径，使得小模型也能有效探索推理空间，从而实现信号放大。

在多个领域的性能测试中，VibeThinker-1.5B 的表现也超过了许多大型开源和商业模型。其开放源代码的发布，打破了对模型参数规模和计算强度的传统看法，展示了小型模型在特定任务中也能取得优异表现的可能性。

微信关注我们

原文链接：https://www.oschina.net/news/383299

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenAI 发布 GPT-5.1：引入“自适应推理”机制、支持更多对话风格

OpenAI正式发布了GPT-5.1系列模型，这是对GPT-5的迭代升级版本，旨在提升ChatGPT的智能水平与对话体验。新版本包含两个核心模型： GPT-5.1 Instant：默认模型，主打快速响应与自然对话。新增“自适应推理”机制，能根据问题复杂度动态调整思考时间，简单问题快速回答，复杂问题深度思考。语气更亲切，指令遵循能力显著提升。 GPT-5.1 Thinking：高级推理模型，复杂任务思考更深入，回答更详尽，同时减少专业术语，提升易读性。此外，OpenAI还推出了八大可选对话风格和实时个性化设置功能，用户可通过滑块调节回答简洁度、温暖度等细节。此次升级是针对GPT-5被批“缺乏人味”的针对性优化，付费用户可优先体验，旧版模型将保留三个月供用户过渡。 OpenAI公司CEO萨姆·奥尔特曼表示，GPT-5.1升级给力，尤其是指令遵循和自适应思考的改进。当然，整体的智力和沟通风格，提升也很显著。

2025-11-13

120

马斯克近日在社交平台 X 上引发热议，他回应网友对该平台算法改进的赞美，并透露了一个消息：到下个月，Grok 将能够每天查看和理解约1亿条 X 帖子。这些帖子不仅包括文本内容，还涵盖了丰富的图像和视频，无论用户账户的规模如何，Grok 都将通过内容的内在质量来向用户推荐信息。 Grok 是一个基于先进算法的智能推荐系统，其目标是通过深入分析用户生成内容的质量，提升用户的体验。马斯克表示，未来的 Grok 将使得平台上的每一个帖子都能获得应有的关注，尤其是那些小账户发布的高质量内容。这一更新意味着，社交媒体的内容推荐将不再仅仅依赖于用户的粉丝数量或账户影响力，而是会更加关注每条帖子的实际价值。

2025-11-13

129

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。