AI 提速 3 倍,交付反而慢了?

—— 阿明餐厅"代码量暴涨但价值下滑"的复盘

阿明餐厅·续集 19


一、开场:老板阿明的"AI 革命 2.0"

2026 年下半年,阿明的餐厅连锁开到第 80 家。

续集 18 那场"AI 写代码翻车"的复盘会后,阿明做了 3 个决定(AI 协作工程师 + Harness + 工程责任不可下放)。现在他想看看"AI 革命"的真实收益

季度汇报会上,研发负责人小王兴奋地展示数据:

指标6 个月前现在提升
代码提交量1.2 万行/月3.8 万行/月🚀 +217%
采纳的 AI 代码03.2 万行/月——
AI 代码采纳率——84%——
新功能上线数8 个/月14 个/月+75%
Token 月成本$0$8.5 万新增

老板阿明看完数据,拍桌子:“再招 5 个 AI 协作厨师(Cursor + Claude Code),明年开到 200 家!”

阿明的厨房类比(开篇场景):上面这张表就像阿明的厨房数据 —— “新菜数"暴涨(从 8 道/月到 14 道/月),但"差评数"也跟着暴涨(从 8 条/月到 23 条/月)。阿明只看到"新菜多了”(代码量暴涨),但没看到"顾客投诉多了"(事故 + 差评)。这是典型的"厨房效率悖论" —— 出餐速度提升,但顾客满意度反而下降。

小王欲言又止,但被 CEO 的兴奋打断了。


二、第一幕:6 个月后,账单来了

到了年底盘点,技术总监老张拿出另一份数据——质量与运营指标

指标6 个月前现在变化
生产 bug 数12/月58/月❌ +383%
P0 事故数0/月2/月❌ +200%
客户投诉(系统类)8/月23/月❌ +188%
工程师平均加班35 小时/月62 小时/月❌ +77%
工程师离职率8%/年22%/年❌ +175%
月度云成本$4 万$15 万❌ +275%
Token + 云 总成本$4 万$23.5 万❌ +488%

阿明傻眼了:“新菜数涨了 3 倍,差评数也涨了 5 倍,成本涨了快 5 倍——这到底是怎么回事?”

阿明的厨房类比(第一幕):把"代码量"换成"菜品数",“Bug"换成"差评”,这张表就一目了然 —— 阿明的厨房从"每天 8 道新菜(手工研制)“变成"每天 14 道新菜(AI 协助)”,但"差评"从每月 8 条涨到 23 条。这就是 AI 时代的"厨房效率悖论" —— 出餐快了,但顾客投诉也多了


三、第二幕:老张用数据复盘

老张拿出了 Waydev、GitClear、Faros AI、Jellyfish 等 4 大研究的最新数据,开始逐项拆解。他把每个数据都翻译成厨房场景,让阿明秒懂。


三、第二幕:老张用数据复盘

老张拿出了 Waydev、GitClear、Faros AI、Jellyfish 等 4 大研究的最新数据,开始逐项拆解。

数据 1:Waydev——“采纳率 ≠ 有效率”
AI 代码采纳率:84%(看着很美)
但 6 周后这些代码还在吗?
  ┌──────────────────────────────────────────┐
  │ 80-90% 采纳率  →  6 周后只剩 10-30% 留存  │
  │                                              │
  │ 这就是"代码流失"(Code Churn)—— AI 代码     │
  │ 被采纳、被修改、被重写、被删除,最终没留下    │
  │ 任何有效价值                                  │
  └──────────────────────────────────────────┘

老张解释:“我们 84% 的采纳率看似很高,但6 周后真正留在生产环境的 AI 代码可能只有 20-30%——其余的不是被改就是被删,相当于做了无用功。”

数据 2:GitClear——“AI 代码修改率 9.4 倍”
非 AI 时代的代码:平均 2 周内被修改 1 次
AI 时代的代码:   平均 2 周内被修改 9.4 次

意味着:
  ✅ 工程师短期内"提交"得快
  ❌ 但代码"稳定"得慢,bug 更多、技术债更深

老张苦笑:“团队感觉’产出多了’,其实是修改次数多了,不是有效产出多了。”

数据 3:Faros AI——“代码变更率 +861%”
PR 数:+861%
这意味着工程师疲于应付 PR review
  → review 质量下降
  → 漏掉的 bug 上升
  → 线上事故率上升
数据 4:Jellyfish——“吞吐量 2 倍,Token 10 倍”
吞吐量(commit 数):+200%
Token 成本:          +1000%

投入产出比:
  1 个工程师的成本 = 工资 + Token 订阅
  AI 时代的"边际成本"反而上升了

老张算了一笔账:“智能灶订阅费 + 食材成本 + 厨师加班费 + 离职补偿金,AI 时代的总成本可能比 AI 之前还高 30%。”

厨房类比:老张换算给阿明听 ——“老板,1 个 AI 协作厨师的月成本 = 工资(2 万)+ AI 订阅(3000)+ 智能灶(5000)+ 食材浪费(8000)= 3.6 万/月,比传统厨师贵 80%。但产出只提升了 50%。边际成本反而上升了。”


四、第三幕:3 大真相

老张在白板上画了 3 个真相。每个真相都用"厨房场景"翻译:

真相 1:AI 是放大器,不是替代品(DORA 2025)

DORA 2025 报告核心结论:“AI 是放大器,放大组织已有的优势和劣势。”

厨房类比:AI 不是"新厨师",而是"新厨房设备"(智能灶、自动翻炒机)。好厨师 + 智能灶 → 大厨级别(米其林出品);烂厨师 + 智能灶 → 更快地做出烂菜(1 小时出 100 道糊了的菜)。

  • 好的团队 + AI → 更好(出品稳定、研发新菜快)
  • 烂的团队 + AI → 更烂(出品失控、差评暴涨)
  • 阿明的厨房在没有"Harness(标准化操作手册)"、没有"试菜流程(review)"的情况下用 AI 设备 → 放大的是"烂"
真相 2:初级 vs 资深工程师的鸿沟
资深工程师用 AI:
  - 知道 AI 写的代码哪里需要 review
  - 知道哪些是陷阱、哪些可以采纳
  - 采纳率 60-70%,但修改率 1.5x
  - 实际价值:显著提升 ✅

初级工程师用 AI:
  - 看到 AI 生成的代码就"哇好厉害"
  - 全部采纳,几乎不 review
  - 采纳率 90%,但修改率 9.4x
  - 实际价值:反而下降 ❌

老张:“初级工程师用 AI 越多,返工量越大——他们缺乏识别’哪些代码是 AI 幻觉、哪些是过时的库、哪些有安全漏洞’的能力。”

真相 3:代码量 ≠ 价值
传统考核:代码行数、commit 数、PR 数
  → AI 让这些数字暴涨
  → 但实际交付价值(用户满意度、生产稳定性)反而下滑

真正的考核应该是:
  - 有效功能数(用户能用、爱用)
  - 生产稳定性(MTTR / 事故率)
  - 技术债(认知债 / 代码流失率)
  - Token 投入产出比

五、第四幕:阿明的最终决定

复盘后,阿明做了 4 个决定:

1. 改考核指标:不再看代码量,看有效价值
旧考核新考核
代码行数有效功能交付数
Commit 数变更失败率
AI 采纳率6 周后代码留存率
工程师产出MTTR / 客户满意度
2. 强制 Harness 流程
  • 所有 AI 代码必须经过资深工程师 review 才能合并
  • 关键模块(支付、安全)禁止 AI 直接写,必须人工
  • 引入 Claude Code 的 Hooks 自动校验
3. Token 成本透明化
  • 每个工程师每月 Token 预算 $2000
  • 超预算的需要 review 工作流
  • 引入 cheaper 模型做"参考",expensive 模型做"决策"
4. 初级工程师强制培训
  • 3 个月"AI 协作工程"专项培训
  • 必须识别 5 类 AI 常见陷阱(安全/性能/幻觉/过时/技术债)
  • 通过考试才能参与 AI 项目

3 个月后(阿明的厨房新指标):

  • 新菜数:从 14 道/月降到 9 道/月(-34%)—— 数量降了
  • 差评数:从 23/月降到 9/月 —— 质量升了
  • 招牌菜留存率:从 22% 升到 68% —— 价值升了
  • 厨师加班:从 62 小时降到 40 小时 —— 健康升了
  • AI 订阅费:从 $8.5 万降到 $5 万 —— 成本降了

厨房类比:阿明最终把"代码量考核"换成"招牌菜留存率考核"。3 个月后 —— 新菜少了 34%,但每道菜都是真招牌,差评少了 60%,回头客多了 50%。这才是 AI 时代的正确玩法:少而精,不多而烂

阿明在年终总结写道:

“AI 不是让代码变多,而是让有效代码变多。2026 年我们最大的教训是:不要被 AI 的数量迷惑,要看 AI 的价值。”


六、给所有研发管理者的启示

  1. AI 提速 ≠ 价值提升——数据告诉你,吞吐量 2 倍时事故可能 5 倍
  2. 采纳率 ≠ 有效率——Waydev 的"采纳率 80% → 留存 30%"是最重要的反直觉数据
  3. 初级 ≠ 更受益——DORA 2025 明确指出 AI 放大的是"已有能力",不是"弥补差距"
  4. 考核要换指标——考核代码量的团队会被 AI 反噬

七、相关章节


📅 2026-06-28 · 续集 19 · AI 时代反思 · 阿明餐厅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值