微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型
微博的人工智能部门推出了开源的 VibeThinker-1.5B,这是一个拥有15亿参数的大型语言模型(LLM),基于阿里巴巴的 Qwen2.5-Math-1.5B 进行的精细调整。
尽管 VibeThinker-1.5B 体积小,但在数学和代码任务上表现出色,达到了行业领先的推理性能,甚至超越了体量达6710亿参数的竞争对手 DeepSeek 的 R1模型。该模型还与 Mistral AI 的 Magistral Medium、Anthropic 的 Claude Opus4和 OpenAI 的 gpt-oss-20B Medium 等多个大型模型抗衡,同时所需的基础设施和投资成本却少得多。
值得一提的是,VibeThinker-1.5B 在后期训练中仅花费了7800美元的计算资源,这一成本远低于同类或更大规模模型所需的数十万美元甚至数百万美元。LLM 的训练分为两个阶段,首先是预训练,模型通过大量文本数据学习语言结构和一般知识。之后的后期训练则使用更小的高质量数据集,使模型能够更好地理解如何提供帮助、进行推理和与人类期望对齐。
VibeThinker-1.5B 采用了一种名为 “谱 - 信号原则”(Spectrum-to-Signal Principle,SSP)的训练框架,该框架将监督微调和强化学习分为两个阶段。第一个阶段注重多样性,第二个阶段则通过强化学习优化最优路径,使得小模型也能有效探索推理空间,从而实现信号放大。
在多个领域的性能测试中,VibeThinker-1.5B 的表现也超过了许多大型开源和商业模型。其开放源代码的发布,打破了对模型参数规模和计算强度的传统看法,展示了小型模型在特定任务中也能取得优异表现的可能性。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
OpenAI 发布 GPT-5.1:引入“自适应推理”机制、支持更多对话风格
OpenAI正式发布了GPT-5.1系列模型,这是对GPT-5的迭代升级版本,旨在提升ChatGPT的智能水平与对话体验。 新版本包含两个核心模型: GPT-5.1 Instant:默认模型,主打快速响应与自然对话。新增“自适应推理”机制,能根据问题复杂度动态调整思考时间,简单问题快速回答,复杂问题深度思考。语气更亲切,指令遵循能力显著提升。 GPT-5.1 Thinking:高级推理模型,复杂任务思考更深入,回答更详尽,同时减少专业术语,提升易读性。 此外,OpenAI还推出了八大可选对话风格和实时个性化设置功能,用户可通过滑块调节回答简洁度、温暖度等细节。 此次升级是针对GPT-5被批“缺乏人味”的针对性优化,付费用户可优先体验,旧版模型将保留三个月供用户过渡。 OpenAI公司CEO萨姆·奥尔特曼表示,GPT-5.1升级给力,尤其是指令遵循和自适应思考的改进。当然,整体的智力和沟通风格,提升也很显著。
-
下一篇
马斯克:Grok 将能够每天解读 1 亿条 X 帖子
马斯克近日在社交平台 X 上引发热议,他回应网友对该平台算法改进的赞美,并透露了一个消息:到下个月,Grok 将能够每天查看和理解约1亿条 X 帖子。 这些帖子不仅包括文本内容,还涵盖了丰富的图像和视频,无论用户账户的规模如何,Grok 都将通过内容的内在质量来向用户推荐信息。 Grok 是一个基于先进算法的智能推荐系统,其目标是通过深入分析用户生成内容的质量,提升用户的体验。马斯克表示,未来的 Grok 将使得平台上的每一个帖子都能获得应有的关注,尤其是那些小账户发布的高质量内容。 这一更新意味着,社交媒体的内容推荐将不再仅仅依赖于用户的粉丝数量或账户影响力,而是会更加关注每条帖子的实际价值。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Docker容器配置,解决镜像无法拉取问题
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程



微信收款码
支付宝收款码