从一张 287 美元账单到 4.4 万 star 的开源传奇:Netflix 工程师如何用 Headroom 为 AI Agent “瘦身” 90% 的 Token
2026 年 1 月,Netflix 高级工程师 Tejas Chopra 在做一件全世界开发者每天都在做的事情——用 AI 编程助手调试一个个人项目的代码。他调用了数据库查询的 MCP 工具,做了一些代码重构,跑了几轮迭代。然后账单来了:Claude Sonnet 的一次会话花了他 287 美元。 这个数字对于一次"典型的家庭项目"来说过于刺眼。Chopra 翻查了 Token 消耗明细,发现了一个他称之为"丑陋真相"的事实:他手写的提示词只占了一小部分,绝大多数 Token 消耗来自机器生成的膨胀数据,其中包括冗余的 JSON...