现在的 AI 厂商似乎在玩一场危险的博弈。
大家都在聊模型能力,却很少有人盯着账单看。一个很反直觉的现象是:订阅制(Subscription)的价格比 API 便宜了 10 到 40 倍。如果你花 90 美元订阅 Claude,其实相当于白嫖了价值几千美元的 API 调用量。这种补贴行为在 SaaS 领域很常见,但它正在变得不可持续。用户量越大,API 调用越多,厂商的边际亏损就越严重。
更离谱的是,厂商们似乎在打着"Tokenmaxxing"的营销噱头来变相涨价。新版本的 Tokenizer 效率变低,导致同样的任务消耗更多 Token;而 API 单价也在涨。这就像是你在用一个越来越贵的计费器,去跑一个越来越复杂的算法。结果是:用户以为自己在使用更强大的 AI,实际上账单在以更快的速度增长,而性能提升的幅度却没有同步跟上。这种现象在 Agent 场景下尤为明显——当模型需要多次调用自己完成一个任务时,Token 消耗成倍攀升,成本轻松突破几百美元。
有意思的是,这种趋势正在把用户推向另一个极端:开源模型加低成本人力。我们可以算一笔账。如果一个顶级模型的 API 调用成本在不断攀升,而像 DeepSeek 这样的开源模型在性能上已经能达到前沿模型的百分之九十,那么逻辑就变了。与其支付昂贵的"智力税"给美国实验室,不如雇一个懂业务的海外工程师,再配上一个便宜的开源模型。当一名海外工程师的月薪约为 1000 到 2000 美元,他能够熟练使用 DeepSeek 等开源模型完成大部分任务时,支付 30 倍溢价去买前沿模型就变得难以说服人。

当这种组合的性价比在第 11 个月左右超过了纯 API 方案时,前沿实验室的价格天花板就出现了。这不是假设,而是正在发生的事实。Hacker News 上的讨论显示,大量开发者和企业开始重新评估他们的 AI 支出结构:究竟是继续按量计费烧 API,还是投入固定成本培养一个能用好开源模型的团队?
这个场景是否让你想起了软件外包的历史?很多人觉得 AI 会取代外包,但事实可能恰恰相反:AI 正在让"高水平工程师加廉价模型"成为一种新型、高效的"外包"。人类工程师的角色从执行者升级为策略制定者和质量把关者,而具体执行工作交给本地运行的模型完成。这种分工的成本结构完全不同于传统的 API 调用模式——固定的人力成本,可控的模型开销,不存在按调用计费的账单惊喜。
更根本的问题是:前沿实验室的定价策略可能是一种在盈利压力下的短期套现,而非可持续的商业模式。训练这些模型需要数亿美元甚至更多的资本投入,而市场是否真的愿意长期为此买单,正在受到越来越多的质疑。没有一家前沿 AI 公司目前是盈利的,它们都在靠投资维持运转。当投资人开始要求看到清晰的盈利路径时,涨价就成了最直接的手段——但这也是最危险的手段,因为它正在 把客户推向竞争对手。
有评论者将当前 AI 市场与互联网泡沫相提并论。历史不会简单重复,但有一个规律是通用的:当一项技术的成本结构发生根本性转变时,行业必然经历整合。那些无法在成本效率上找到平衡的企业,可能面临资产减记和业务收缩。能效问题最终也将成为决定性因素——对昂贵的集中式基础设施的依赖,正在成为制约前沿实验室扩张的负担。而本地模型运行在分布式硬件上,边际成本更低,隐私性更好,还能规避数据泄露风险。
对于不需要极高性能的场景,"工程师加本地模型"的组合已经是更具性价比的选择。在 M1 Ultra MacBook 上跑 Qwen 35B A3B,8 位量化后即可流畅运行,每秒 45 个 tokens 的速度足以应付日常开发工作。隐私敏感的企业尤其青睐这种方式——数据不必离开本地网络,就能完成大部分任务。
到底是一个全能但昂贵的"上帝模型"能统治世界,还是无数个"足够好"的小模型加上人类的监督能构建未来?这个问题,可能还没到能给出答案的时候。但有一点是确定的:当账单开始失控的时候,人们就会开始重新思考什么才是真正的"智能",以及我们愿意为它支付怎样的价格。
参考来源
https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs
https://news.ycombinator.com/item?id=48278610