AI 开发经济学改写:从行政驱动到技术质变,Token 消耗策略大转变

【导语:去年 Meta 将员工 Token 消耗量纳入绩效考核,引发无意义消耗现象。如今,Tokenmaxxing 迎来第二阶段,由技术质变驱动,改写了 AI 开发的经济学,同时也带来了安全攻防和权力分配的新变化。】


序号1

Tokenmaxxing 第一阶段:行政驱动的无意义消耗

去年 Meta 把员工的 Token 消耗量写进绩效考核,导致员工让两个 Agent 互相对话一整天来刷量,这种现象被称为 tokenmaxxing。这是因为大量资历老的员工抗拒 AI 工具,公司只能用行政手段推动团队使用 AI。

序号2

Tokenmaxxing 第二阶段:技术质变带来新逻辑

如今,Tokenmaxxing 的第一阶段已经结束,第二阶段开始,逻辑恰恰相反。这次是技术本身出现了质变,模型质量越过临界点,token 烧得越多,输出质量越好。以前让 Agent 长时间跑会出现 compounding error,现在“loops”模式基本是每多跑一轮就更好一点。

这个变化直接改写了 AI 开发的经济学,成本效率的计算不再是哪个模型单次调用最便宜,而是哪个模型能在等预算下跑更多轮。

序号3

不同模型成本效率对比

以 Claude Opus 和 GLM 5.2 为例,Claude Opus 每轮迭代带来 1.1× 的提升,GLM 5.2 带来 1.05×,但 GLM 的价格只有 Claude 的 1/5。多跑几轮之后,便宜模型反而在前头。GLM 5.2 约 $1.40/M 输入、$4/M 输出;Opus 4.X 是 $5/M 输入、$25/M 输出。GLM 5.2 在部分 benchmark 上已经超过 GPT 5.5,Haiku 4.5 更是被碾压。

序号4

安全攻防与权力分配新变化

Anthropic 的 Mythos 模型在 AISI 的网络安全测试里,100M token 预算下没有出现任何边际收益递减的迹象,这意味着安全攻防正在变成经济战,谁能比对手多烧 token 谁就赢。

OpenAI 发布了首款自研推理芯片 Jalapeño,和 Broadcom 合作,专门针对自有推理负载优化,模型参与了芯片设计。GPT 5.6 系列通过了美国政府协调的预览,这表明 AI 能力的分配权力正在从行业转移到政府。

编辑观点:Tokenmaxxing 的转变反映了 AI 技术的快速发展,从行政驱动到技术驱动,将对 AI 开发和应用产生深远影响。开发者需重新考虑成本效率,行业竞争也将更加激烈。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值