开源大模型之争,谷歌向左,Meta 向右。
就在
谷歌宣布 Gemma 4 全面拥抱开源之后的第 6 天,Meta 在官网发出一则公告,宣布新一代大模型 Muse Spark 正式上线。公告写道,这是“Meta有史以来最强大的模型”,将通过 meta.ai 和 Meta AI 应用向用户开放。公告里没有 GitHub 链接,没有模型权重下载地址,没有 HuggingFace 页面 —— 过去两年,每一次 Llama 系列发布,这三样东西都是标配。
这一次,什么都没有。
开源人设的建立
2023 年 2 月,Meta 首次发布 LLaMA。那次的发布本来是“学术限定”,即仅对研究机构开放,附上申请表即可免费使用。但没过几天,模型权重就被人贴在了 4chan 上,随即在整个互联网扩散。
泄露是意外,但 Meta 做了一个主动选择: 没有追究,也没有撤回,而是顺势转向全面开放。
从那之后,开源成了扎克伯格的主动人设,也成了他对外抢占舆论阵地的武器。彼时他在博客里写了一篇长文,直接点名批评 OpenAI:“封闭AI对社会不利,开源才能建立真正的信任。”每次 Llama 新版发布,他都会亲自上阵社交媒体宣传,强调权重下载免费、商用不受限。这套逻辑被他讲了又讲:开源不是慈善,是让开发者绕开竞争对手、直接在 Meta 的生态里建东西。
到 Llama 3 时,这个人设已经完全立住了。Llama 系列累计下载量超过 12 亿次,依托它建立技术栈的初创公司数以千计。AI 圈的一个段子是:OpenAI 在挖护城河,Meta 在填护城河。
刷榜留下的裂痕
2025 年 4 月,Meta 发布 Llama 4,宣称在多项基准测试中超越了 GPT-4.5 和 Claude Sonnet 3.7,然而在发布会后不到 48 小时,争议出现了。
社区里有人注意到,Meta 提交给 LM Arena 进行评测的 Maverick 版本,和公开供下载的版本 不是同一个东西。有匿名帖子(自称来自 Meta 前工程师)声称,Llama 4 团队调整了训练后处理的数据集,以获取更漂亮的基准分数。
Meta 副总裁 Ahmad Al-Dahle 出面否认,说公司没有在测试集上直接训练。但他没能提供验证这一说法所需的技术细节和原始数据,回应略显苍白。
更实际的问题随后出现了:开发者拿到模型之后,真实使用效果和发布会上的数字对不上。Llama 4 的下载量和开发者采纳率都远低于预期。与此同时,中国的 Qwen 和 GLM 系列在海外下载量上开始反超。
开源人设背后的支撑 —— 大模型性能优势,开始松动。
143 亿美元挖来的华裔天才
2025 年 4 月,扎克伯格主动联系 Alexandr Wang,邀请对方喝咖啡。
这位 1997 年出生的华裔天才是 Scale AI 的创始人,他的父母是洛斯阿拉莫斯国家实验室的核物理学家,他高中时参加全美数学竞赛,以出色的成绩进了 MIT,大一结束后辍学创业。
Scale AI 做的事不算性感 —— 为 AI 公司做数据标注、模型评估 —— 但整个行业都离不开它。OpenAI、Google、Meta 都是它的客户。2021 年,Wang 以 24 岁的年纪成为全球最年轻的“白手起家亿万富翁”。
两人在塔霍湖和帕洛阿尔托见了几次面。两个月后,协议落地:Meta 以 143 亿美元收购 Scale AI 49% 的非投票股权,Wang 以“Meta 首席 AI 官”身份加盟,领导新成立的 Meta Superintelligence Labs(MSL),直接向扎克伯格汇报。协议里有一条“毒丸条款”:若 Wang 离职,其股权将按 1.5 倍稀释,折算下来约有 50 亿美元的“违约金”。
Meta 对外的说法是“重建整个 AI 技术栈”。内部知情者的说法更直白:Llama 路线已经走到天花板,要正面和 OpenAI、Gemini 打,需要一支全新的队伍。
Wang 接手后,MSL 花了九个月时间,做出了 Muse Spark。
重返第一梯队
Muse Spark 的内部代号是“Avocado”,从架构上就不是 Llama 的延伸。它是原生多模态设计,视觉和文本在底层融合,不是事后拼接进去的。
它有三种工作模式:即时模式处理日常对话,思考模式用于复杂推理,“沉思模式”(Contemplating Mode)尚未全面上线 —— 它会协调多个子代理并行推理,对标的是 GPT-5.4 和 Gemini 3.1 Pro 的顶级推理能力。
Meta 重点介绍了一种叫“思维压缩”(Thought Compression)的训练技术,声称以少 10 倍的算力消耗达到了与 Llama 4 Maverick 相当的推理能力。第三方评测机构 Artificial Analysis 给 Muse Spark 在 Intelligence Index 上打了 52 分,全球第四,排在 Gemini 3.1 Pro Preview(57分)、GPT-5.4(57分)和 Claude Opus 4.6(53分)之后。作为对照,Llama 4 Maverick 在同一评测里仅得了 18 分。
多模态推理(CharXiv测试)得分 86.4,高于 GPT-5.4 的 82.8 和 Gemini 3.1 Pro 的 80.2;医疗推理(HealthBench Hard)得分 42.8,远高于 Claude 4.6 的 14.8。
数字本身说明不了全部,但结论是清晰的:Muse Spark 在性能上,确实进入了第一梯队。
封闭的信号
Muse Spark 目前只通过 meta.ai 和 Meta AI 应用提供,没有下载渠道,没有开放 API,仅有少数所谓的“精选合作伙伴”获得了私有 API 预览权。
Meta 发言人给出的说法是:“当前的 Llama 模型将继续以开源形式提供。”Wang 在 X 上发帖承认转型“存在一些需要打磨的粗糙之处”,并表示“计划在未来的版本开源”。
这给开发者读到的信号是: 最好的模型,不会再开源了。
「当前的 Llama 模型」这个措辞被反复咀嚼。这不是“我们会继续开源”,而是“我们已有的这些还开着”。“未来版本计划开源”也不是承诺,是可以随时收回的意向。
这对依赖 Llama 生态的团队来说是很现实的问题。初创公司的技术选型、研究机构的模型访问、个人开发者的工具链,都建立在“Meta 会把最好的东西开放出来”这个假设上,而这个假设在今天已经站不住脚了。
开源倡导者的落幕
Meta 的开源哲学从来不是纯粹的理想主义,它是一种策略:用开放的模型建立开发者生态,用生态建立竞争壁垒,用竞争壁垒绕开和 OpenAI 的正面交锋。这个策略在 Llama 3 时代运转得很好,在 Llama 4 时代开始失灵。
竞争格局变了。开源市场里,Qwen 和 GLM 来势汹汹;闭源市场里,GPT-5 和 Gemini 3 在性能上甩开了距离。Meta 的处境是:在开源端被追赶,在闭源端没有入场券。
Muse Spark 是 Meta 购买闭源赛场入场券下的一步棋。
扎克伯格没有正式宣布放弃开源。他说的是“计划开源未来版本”。但对于已经把业务建在 Llama 上的开发者来说,这句话的意思很清楚:当 Meta 有更好的模型可以端上来卖钱的时候,开源的那个将会是上一代。
Meta 不是第一家走这条路的公司。两年前,AI 圈里有一句被反复引用的扎克伯格金句:“闭源 AI 对社会不利。”那句话今天读起来,已经是另一番滋味。
参考来源