AI 开发经济学改写：从行政驱动到技术质变，Token 消耗策略大转变

转载于 2026-06-30 17:32:55 发布 · 5 阅读

【导语：去年 Meta 将员工 Token 消耗量纳入绩效考核，引发无意义消耗现象。如今，Tokenmaxxing 迎来第二阶段，由技术质变驱动，改写了 AI 开发的经济学，同时也带来了安全攻防和权力分配的新变化。】

Tokenmaxxing 第一阶段：行政驱动的无意义消耗

去年 Meta 把员工的 Token 消耗量写进绩效考核，导致员工让两个 Agent 互相对话一整天来刷量，这种现象被称为 tokenmaxxing。这是因为大量资历老的员工抗拒 AI 工具，公司只能用行政手段推动团队使用 AI。

Tokenmaxxing 第二阶段：技术质变带来新逻辑

如今，Tokenmaxxing 的第一阶段已经结束，第二阶段开始，逻辑恰恰相反。这次是技术本身出现了质变，模型质量越过临界点，token 烧得越多，输出质量越好。以前让 Agent 长时间跑会出现 compounding error，现在“loops”模式基本是每多跑一轮就更好一点。

这个变化直接改写了 AI 开发的经济学，成本效率的计算不再是哪个模型单次调用最便宜，而是哪个模型能在等预算下跑更多轮。

不同模型成本效率对比

以 Claude Opus 和 GLM 5.2 为例，Claude Opus 每轮迭代带来 1.1× 的提升，GLM 5.2 带来 1.05×，但 GLM 的价格只有 Claude 的 1/5。多跑几轮之后，便宜模型反而在前头。GLM 5.2 约 $1.40/M 输入、$4/M 输出；Opus 4.X 是 $5/M 输入、$25/M 输出。GLM 5.2 在部分 benchmark 上已经超过 GPT 5.5，Haiku 4.5 更是被碾压。