微博开源 VibeThinker-1.5B，低成本 AI 模型挑战大型语言模型-低调大师

微博开源 VibeThinker-1.5B，低成本 AI 模型挑战大型语言模型

2025-11-13 38

微博的人工智能部门推出了开源的 VibeThinker-1.5B，这是一个拥有15亿参数的大型语言模型（LLM），基于阿里巴巴的 Qwen2.5-Math-1.5B 进行的精细调整。

尽管 VibeThinker-1.5B 体积小，但在数学和代码任务上表现出色，达到了行业领先的推理性能，甚至超越了体量达6710亿参数的竞争对手 DeepSeek 的 R1模型。该模型还与 Mistral AI 的 Magistral Medium、Anthropic 的 Claude Opus4和 OpenAI 的 gpt-oss-20B Medium 等多个大型模型抗衡，同时所需的基础设施和投资成本却少得多。

值得一提的是，VibeThinker-1.5B 在后期训练中仅花费了7800美元的计算资源，这一成本远低于同类或更大规模模型所需的数十万美元甚至数百万美元。LLM 的训练分为两个阶段，首先是预训练，模型通过大量文本数据学习语言结构和一般知识。之后的后期训练则使用更小的高质量数据集，使模型能够更好地理解如何提供帮助、进行推理和与人类期望对齐。

VibeThinker-1.5B 采用了一种名为 “谱 - 信号原则”（Spectrum-to-Signal Principle，SSP）的训练框架，该框架将监督微调和强化学习分为两个阶段。第一个阶段注重多样性，第二个阶段则通过强化学习优化最优路径，使得小模型也能有效探索推理空间，从而实现信号放大。

在多个领域的性能测试中，VibeThinker-1.5B 的表现也超过了许多大型开源和商业模型。其开放源代码的发布，打破了对模型参数规模和计算强度的传统看法，展示了小型模型在特定任务中也能取得优异表现的可能性。

微信关注我们

原文链接：https://www.oschina.net/news/383299

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

无需调整现有路由器！蒲公英X1 Pro旁路组网远程访问NAS攻略

许多人都在使用群晖(Synology)、飞牛fnOS、威联通(QNAP)、铁威马TOS等品牌NAS系统，理想状态下是能够随时随地访问家里的资料库，浏览照片、下载文件、备份数据。但在实际使用中，这些NAS自带的远程访问方式往往会在速度和稳定性上表现不佳。无论是群晖的QuickConnect，还是其他品牌的远程访问方案，常常因为中转节点拥堵、上行带宽受限或NAT环境复杂而出现访问缓慢、连接中断的问题。更麻烦的是，如果你使用的是“黑群晖”、UNRAID或TrueNAS等自建NAS系统，往往根本没有官方提供的远程访问工具，需要自己折腾公网IP、端口映射或VPN。面对这些痛点，贝锐蒲公英X1 Pro提供了一个极为优雅的解决方案，无需公网IP、无需复杂配置，即可轻松实现对家中NAS及其他设备的远程访问。蒲公英X1 Pro基于贝锐自研的SD-WAN异地组网技术，能够在不同网络之间自动建立远程访问通道，实现安全稳定的异地互联。与传统VPN不同，X1 Pro支持“旁路模式”，无需更换主路由，也不用重新配置网络结构，只需像普通设备一样接入家庭局域网即可。蒲公英X1 Pro旁路组网：一插即用、无...

2025-11-14

80

在物联网技术日新月异的今天，数据指数级增长、数据类型愈发多样，场景日益复杂且变化迅速。一款真正好用的数据库必须具备强大的适应能力和不断进化的能力，从架构设计到性能优化，全方位提升自身能力，以适应物联网时代的数据管理需求。今天，KaiwuDB V3.0 全新发布，将高性能时序数据处理、多模融合、分布式、安全特性、AI 等诸多能力集于一体，为企业提供高性能、高可靠、低成本且易运维的一站式数据管理解决方案，帮助企业有效应对物联网时代海量、实时、多模数据的管理挑战，实现降本增效和数据驱动业务创新的双重目标。 KaiwuDB V3.0 产品特性全景图划重点 | KaiwuDB 3.0 七大新特性 01 多模架构增强 KaiwuDB 多模架构通过单一数据库系统统一管理时序数据和关系数据，可简化技术架构，降低开发和运维复杂度及成本。V3.0 支持高效跨模连接算子与时序算子并行处理，相较于 V2.2 跨模查询性能提升 5-10 倍，打破了不同数据模型间的壁垒，为物联网中多源异构数据的融合分析提供了可能。多模架构，一库多用 02 时序性能增强 KaiwuDB V3.0 通过追加写的方式，充分发...

2025-11-13

57

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。