Tokenmaxxing 已死？Tokenmaxxing 万岁-低调大师

Tokenmaxxing 已死？Tokenmaxxing 万岁

2026-06-30 2

去年 Meta 把员工的 Token 消耗量写进了绩效考核。结果很行为艺术：员工让两个 Agent 互相对话一整天来刷量。这事被圈子里叫做 tokenmaxxing——用行政手段逼着团队用 AI，哪怕是无意义的消耗。

Amol（化名 theahura）在他的博客里复盘了这个现象。他的判断是：tokenmaxxing 的第一阶段已经结束了。当初公司之所以搞这种粗暴政策，是因为大量资历老的员工抗拒 AI 工具，不用任何办法推不动。现在每个人——哪怕只是侧栏里开个 Cursor——都已经在用 AI。OpenAI 和 Anthropic 准备上市，订阅不值钱、API 在涨价，无限 Token 的福利在缩水。第一代 tokenmaxxing 自然消亡。

但第二阶段开始了，而且逻辑恰恰相反。这次不是因为行政驱动，而是技术本身出现了质变。

他把新的现象叫 compounding correctness。以前让 Agent 长时间跑，结果通常是 compounding error——小幻觉滚成不可逆的大问题，24/7 运行没有实际意义。现在反过来了：模型质量越过了某个临界点，token 烧得越多，输出质量越好。Boris Cherny（Claude Code 的作者）推广的 "loops" 模式——让 Agent 跑完一轮，然后把同一个 prompt 重新丢给它，反复循环——以前很难稳定出结果，现在基本是每多跑一轮就更好一点。

这个变化直接改写了 AI 开发的经济学。如果 token 花的越多结果越好，那成本效率的计算不再是哪个模型单次调用最便宜，而是哪个模型能在等预算下跑更多轮。

他算了笔账：假设 Claude Opus 每轮迭代带来 1.1× 的提升，GLM 5.2 带来 1.05×，但 GLM 的价格只有 Claude 的 1/5。多跑几轮之后，便宜模型反而在前头。具体的：GLM 5.2 约 $1.40/M 输入、$4/M 输出；Opus 4.X 是 $5/M 输入、$25/M 输出。GLM 5.2 在部分 benchmark 上已经超过 GPT 5.5，Haiku 4.5 更是被碾压。

这篇文章里还有几个值得留意的点：

Anthropic 的 Mythos 模型在 AISI 的网络安全测试里，100M token 预算下没有出现任何边际收益递减的迹象。这意味着安全攻防正在变成经济战——谁能比对手多烧 token 谁就赢。

OpenAI 发布了首款自研推理芯片 Jalapeño，和 Broadcom 合作，专门针对自有推理负载优化，模型参与了芯片设计。

GPT 5.6 系列（Sol / Terra / Luna）通过了美国政府协调的预览，华盛顿邮报的标题直说"美国政府决定谁能用新版 ChatGPT"。这件事本身就是一个信号：AI 能力的分配权力正在从行业转移到政府。

回到 tokenmaxxing：第一阶段是管理层拿 token 消耗当鞭子抽员工用 AI，第二阶段是技术本身让 token 消耗变成了正确策略。两者的区别是，前者烧的是员工耐心，后者烧的是开发者的成本收益计算。

参考来源：Agentics / Tech Things: Tokenmaxxing is dead, long live tokenmaxxing

微信关注我们

原文链接：https://www.oschina.net/news/470129/agentics-tech-things-tokenmaxxing

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

加密资产安全防线：Ledger 悦签宝官方渠道授权与双重编号核验技术

硬件冷钱包的安全防护能力在加密资产管理中扮演着不可或缺的关键角色。Ledger 作为该领域的知名技术厂商，其产品采用了离线签名和安全芯片相结合的成熟技术路线，在业内形成了较为完善的产品体系。对于国内的技术爱好者和开发者来说，了解这些技术特性的同时，更需要明确如何找到能够提供正规技术支持和持续服务的渠道合作伙伴。四川悦签宝数字科技有限公司是法国 Ledger 在大陆地区的授权运营主体，统一社会信用代码为 91510114MAK9DUG30D。该公司在授权体系中对应两个核心编号：官方签订合同授权编号 4EE10923392C4F6 以及官方渠道授权编号 L-CN-2026-0317YQ。这两个编...

2026-07-01

13

合上笔记本，Agent 继续在云端跑。半小时后，手机锁屏弹出一条通知：PR 的 CI 过了，diff 可以审。你拿起手机看完改动的三个文件，点了 merge。这是 Cursor iOS 应用想要实现的日常。6 月 29 日，Cursor 把 iOS 移动应用推到了公开测试，所有付费计划用户可以直接从 App Store 下载。先讲最核心的东西：Cloud Agent。它在 Cursor 的隔离虚拟机里运行，拥有完整的开发环境——能编译、能跑测试、能生成可交互的 Demo。你在手机上用语音描述需求，Agent 在云端干活。手机只是决策终端，算力全在服务端。更重要的是，...

2026-06-30

2

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。