AI 提速 3 倍，交付反而慢了？

原创于 2026-06-29 13:58:50 发布 · 261 阅读

4 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #大数据

—— 阿明餐厅"代码量暴涨但价值下滑"的复盘

阿明餐厅·续集 19

一、开场：老板阿明的"AI 革命 2.0"

2026 年下半年，阿明的餐厅连锁开到第 80 家。

续集 18 那场"AI 写代码翻车"的复盘会后，阿明做了 3 个决定（AI 协作工程师 + Harness + 工程责任不可下放）。现在他想看看"AI 革命"的真实收益。

季度汇报会上，研发负责人小王兴奋地展示数据：

指标	6 个月前	现在	提升
代码提交量	1.2 万行/月	3.8 万行/月	🚀 +217%
采纳的 AI 代码	0	3.2 万行/月	——
AI 代码采纳率	——	84%	——
新功能上线数	8 个/月	14 个/月	+75%
Token 月成本	$0	$8.5 万	新增

老板阿明看完数据，拍桌子：“再招 5 个 AI 协作厨师（Cursor + Claude Code），明年开到 200 家！”

阿明的厨房类比（开篇场景）：上面这张表就像阿明的厨房数据 —— “新菜数"暴涨（从 8 道/月到 14 道/月），但"差评数"也跟着暴涨（从 8 条/月到 23 条/月）。阿明只看到"新菜多了”（代码量暴涨），但没看到"顾客投诉多了"（事故 + 差评）。这是典型的"厨房效率悖论" —— 出餐速度提升，但顾客满意度反而下降。

小王欲言又止，但被 CEO 的兴奋打断了。

二、第一幕：6 个月后，账单来了

到了年底盘点，技术总监老张拿出另一份数据——质量与运营指标：

指标	6 个月前	现在	变化
生产 bug 数	12/月	58/月	❌ +383%
P0 事故数	0/月	2/月	❌ +200%
客户投诉（系统类）	8/月	23/月	❌ +188%
工程师平均加班	35 小时/月	62 小时/月	❌ +77%
工程师离职率	8%/年	22%/年	❌ +175%
月度云成本	$4 万	$15 万	❌ +275%
Token + 云总成本	$4 万	$23.5 万	❌ +488%

阿明傻眼了：“新菜数涨了 3 倍，差评数也涨了 5 倍，成本涨了快 5 倍——这到底是怎么回事？”

阿明的厨房类比（第一幕）：把"代码量"换成"菜品数"，“Bug"换成"差评”，这张表就一目了然 —— 阿明的厨房从"每天 8 道新菜（手工研制）“变成"每天 14 道新菜（AI 协助）”，但"差评"从每月 8 条涨到 23 条。这就是 AI 时代的"厨房效率悖论" —— 出餐快了，但顾客投诉也多了。

三、第二幕：老张用数据复盘

老张拿出了 Waydev、GitClear、Faros AI、Jellyfish 等 4 大研究的最新数据，开始逐项拆解。他把每个数据都翻译成厨房场景，让阿明秒懂。

三、第二幕：老张用数据复盘

老张拿出了 Waydev、GitClear、Faros AI、Jellyfish 等 4 大研究的最新数据，开始逐项拆解。

数据 1：Waydev——“采纳率 ≠ 有效率”

AI 代码采纳率：84%（看着很美）
但 6 周后这些代码还在吗？
  ┌──────────────────────────────────────────┐
  │ 80-90% 采纳率  →  6 周后只剩 10-30% 留存  │
  │                                              │
  │ 这就是"代码流失"（Code Churn）—— AI 代码     │
  │ 被采纳、被修改、被重写、被删除，最终没留下    │
  │ 任何有效价值                                  │
  └──────────────────────────────────────────┘

老张解释：“我们 84% 的采纳率看似很高，但6 周后真正留在生产环境的 AI 代码可能只有 20-30%——其余的不是被改就是被删，相当于做了无用功。”

数据 2：GitClear——“AI 代码修改率 9.4 倍”

非 AI 时代的代码：平均 2 周内被修改 1 次
AI 时代的代码：   平均 2 周内被修改 9.4 次

意味着：
  ✅ 工程师短期内"提交"得快
  ❌ 但代码"稳定"得慢，bug 更多、技术债更深

老张苦笑：“团队感觉’产出多了’，其实是修改次数多了，不是有效产出多了。”

数据 3：Faros AI——“代码变更率 +861%”

PR 数：+861%
这意味着工程师疲于应付 PR review
  → review 质量下降
  → 漏掉的 bug 上升
  → 线上事故率上升

数据 4：Jellyfish——“吞吐量 2 倍，Token 10 倍”

吞吐量（commit 数）：+200%
Token 成本：          +1000%

投入产出比：
  1 个工程师的成本 = 工资 + Token 订阅
  AI 时代的"边际成本"反而上升了

老张算了一笔账：“智能灶订阅费 + 食材成本 + 厨师加班费 + 离职补偿金，AI 时代的总成本可能比 AI 之前还高 30%。”

厨房类比：老张换算给阿明听 ——“老板，1 个 AI 协作厨师的月成本 = 工资（2 万）+ AI 订阅（3000）+ 智能灶（5000）+ 食材浪费（8000）= 3.6 万/月，比传统厨师贵 80%。但产出只提升了 50%。边际成本反而上升了。”

四、第三幕：3 大真相

老张在白板上画了 3 个真相。每个真相都用"厨房场景"翻译：

真相 1：AI 是放大器，不是替代品（DORA 2025）

DORA 2025 报告核心结论：“AI 是放大器，放大组织已有的优势和劣势。”

厨房类比：AI 不是"新厨师"，而是"新厨房设备"（智能灶、自动翻炒机）。好厨师 + 智能灶 → 大厨级别（米其林出品）；烂厨师 + 智能灶 → 更快地做出烂菜（1 小时出 100 道糊了的菜）。

好的团队 + AI → 更好（出品稳定、研发新菜快）
烂的团队 + AI → 更烂（出品失控、差评暴涨）
阿明的厨房在没有"Harness（标准化操作手册）"、没有"试菜流程（review）"的情况下用 AI 设备 → 放大的是"烂"

真相 2：初级 vs 资深工程师的鸿沟

资深工程师用 AI：
  - 知道 AI 写的代码哪里需要 review
  - 知道哪些是陷阱、哪些可以采纳
  - 采纳率 60-70%，但修改率 1.5x
  - 实际价值：显著提升 ✅

初级工程师用 AI：
  - 看到 AI 生成的代码就"哇好厉害"
  - 全部采纳，几乎不 review
  - 采纳率 90%，但修改率 9.4x
  - 实际价值：反而下降 ❌

老张：“初级工程师用 AI 越多，返工量越大——他们缺乏识别’哪些代码是 AI 幻觉、哪些是过时的库、哪些有安全漏洞’的能力。”

真相 3：代码量 ≠ 价值

传统考核：代码行数、commit 数、PR 数
  → AI 让这些数字暴涨
  → 但实际交付价值（用户满意度、生产稳定性）反而下滑

真正的考核应该是：
  - 有效功能数（用户能用、爱用）
  - 生产稳定性（MTTR / 事故率）
  - 技术债（认知债 / 代码流失率）
  - Token 投入产出比