【我的一次AI -Vibe Coding 能力评估记录】

Vibe Coding 能力与会话执行介绍

项目:NRD ELN(电子实验记录本)
技术栈:Vue 3 + SpreadJS 17 | .NET 8 + SqlSugar + Oracle
AI 工具链:Cursor IDE + Graphify 知识图谱 + MCP Server
更新日期:2026-06-13


一、会话执行流程

每一次 AI 辅助开发的会话,都遵循以下标准流程:

hotfix

feature / structural

用户输入需求

路由器分类与图谱查询

量级判定

创建 CHG → 直改路径

编排路径

初始化 1 条任务看板

五道门执行

规格工程师:写 Spec/CHG

规划工程师:写 Plan + 拆 Tasks

编排器:初始化看板 + 派发 Agent

TDD:先写测试

实现:编码

测试:lint + build + test

安全:自检四项

AC 验收:逐条对照

汇总结果

刷新任务看板

更新知识图谱

输出会话轨迹

关键节点说明

节点说明
路由器每次会话第一入口,负责问题分类、图谱查询、量级判定
量级判定hotfix(纯新增/修复)→ 直改;feature/structural → 需 Plan + 编排
五道门TDD → 实现 → 测试 → 安全 → AC,每个 Task 必须全部通过
会话轨迹结束时输出 JSONL 格式的执行记录,支持事后回溯

二、各项能力协作关系

💡 通俗理解:把 AI 辅助开发想象成一个工程队——

  • D3 上下文工程 = 📡 导航员(告诉大家"在哪、做什么")
  • D2 工程方法 = 📏 监理(确保流程合规,不允许偷工减料)
  • D1 技术编码 = 🔨 施工队(实际写代码的人)
  • D4 安全与治理 = 🛡️ 安全员(全程巡查,发现隐患立即喊停)
  • D5 组织赋能 = 📚 培训部(沉淀经验,让新人也能快速上手)

告诉去哪

分配任务

全程巡查

全程巡查

全程巡查

产出经验

反哺改进

反哺改进

用户需求

📡 D3 上下文工程
导航:查图谱、定位代码、提供上下文

📏 D2 工程方法
监理:定流程、设门禁、拆任务

🔨 D1 技术编码
施工:写代码、跑测试、交付功能

🛡️ D4 安全与治理
安全员:审查代码、拦截风险

📚 D5 组织赋能
培训部:沉淀模板、记录轨迹

协作逻辑一句话总结

导航员定位 → 监理定规则 → 施工队干活 → 安全员全程盯 → 培训部沉淀经验反哺全员

具体协作方式

从 → 到协作内容
D3 → D2图谱查询结果决定走"直改"还是"编排"路径
D2 → D1SDD 门禁确保编码前有规范、有方案、有看板
D4 → 全员安全规范 + Hook 提醒贯穿设计/实现/测试每一步
D1 → D5每次实施产出任务看板 + 会话轨迹,积累团队知识
D5 → D3/D2模板标准化输入,轨迹分析改进流程

三、能力体系总览

3.1 核心组件一览

Vibe Coding

Rules 规则层

00-core 核心原则

01-sdd-gates SDD门禁

02-agent-git Git授权

03-security 安全规范

04-testing-gates 测试门禁

05-graphify-entry 图谱入口

10~12 代码风格

Skills 技能层

00-router 路由器

10-domain 领域索引

20-capabilities 工程能力

30-orchestrators 编排器

40-roles 角色定义

50-query 查表工具

60-template 模板设计

Hooks 自动化层

guard-claude-shell 结构变更守卫

guard-sdd-implement 编码前门禁

hint-sdd-security 安全提醒

hint-nrd-business-tests 测试提醒

remind-spec-history 规范提醒

Infrastructure 基础设施

Graphify 知识图谱

MCP Server

任务看板

会话轨迹

3.2 各能力详细介绍

🔀 路由器(00-router-skill)
项目说明
定位每次会话的第一入口
功能问题分类 → 图谱查询 → 量级判定 → 路由分发
输出图谱:<词> | <命中/未命中> | graph | <节点>
量级:<hotfix/feature/structural> | 依据:<...> | 路径:<直改/编排>
约束禁止跳过分类;feature/structural 禁止直改
📋 SDD 四阶段工作流(30-sdd-workflow)

产物

产物

产物

产物

规范 Specify

方案 Plan

任务 Tasks

实施 Implement

Spec/CHG 文档

Plan + 评审记录

任务看板 JSON

代码 + 测试 + 轨迹

阶段入口条件产物出口条件
规范图谱行已输出Spec/CHG(含 AC + 安全声明)状态 Approved
方案Spec ApprovedPlan(含架构/影响/Tasks)用户确认
任务Plan 确认任务看板初始化看板与 CHG 一致
实施G1~G5 全通过代码 + 测试 + 看板刷新 + 轨迹所有 AC 覆盖
🎭 六大角色
角色图标职责
规格工程师👷写 Spec/CHG,制定验收标准
规划工程师💂写 Plan,拆解 Tasks
后端工程师🧔实现后端代码与测试
前端工程师🧝实现前端代码与测试
测试工程师🧙补充测试与验收
代码审查员🕵风险审查与结论汇总
🪝 自动化 Hooks

结构变更命令

普通命令

写业务文件

缺失

通过

用户操作

beforeShell

提醒同步 CLAUDE.md

放行

preToolUse

检查 Spec + Plan + 看板

阻止编写

执行写入

postToolUse

安全自检提示

业务测试提示

规范历史提醒

Hook触发时机功能
guard-claude-shellShell 命令前检测目录变更,提醒同步 CLAUDE.md
guard-sdd-implement写文件前检查 Spec/Plan/看板是否就绪(G2/G3/G4)
hint-sdd-security写后端文件后输出安全自检清单
hint-nrd-business-tests写业务文件后输出业务流程测试检查清单
remind-spec-history写 CHG 后提醒更新 Spec 变更历史表
🗺️ Graphify 知识图谱
项目说明
定位项目级上下文记忆与语义检索
核心产物graphify-out/graph.json(机器可读图谱)
MCP 集成通过 MCP Server 暴露给 AI,支持实时查询
强制入图新业务未命中时,同会话结束前必须完成 L0 入图
更新命令graphify update .(增量)/ graphify update . --force(全量)
📐 模板与命令
命令/模板说明
/new-spec快速创建功能规格文档(Draft 状态)
/change-spec快速创建变更设计文档
spec-fr-template功能需求规格模板
chg-template变更设计文档模板(含量级判定)

四、硬门禁与安全机制

编码前门禁(G1~G5)

□ G1  输出了 图谱:... 一行
□ G2  Spec/CHG 状态 ≥ Approved;feature/structural 有 Plan
□ G3  current-task-board.json 已初始化且与 CHG 一致
□ G4  Plan 含 ## Tasks
□ G5  轨迹块已输出

安全贯穿机制

安全声明

安全自检

安全测试

03-security.mdc

hint-sdd-security

04-testing-gates

设计阶段

实现阶段

测试阶段

部署阶段

规则约束

Hook 提醒

测试门禁

安全四项自检:

  1. SQL 防护 — 参数化查询,禁止拼接
  2. 权限验证 — 接口鉴权,数据隔离
  3. 敏感信息 — 禁止硬编码密钥/凭证
  4. 输入验证 — 类型/长度/格式校验

Git 提交最严约束

  • 禁止 AI 自动执行 git add / commit / push
  • 每次提交需用户明确授权
  • 提交前必须通过 lint + build + 结构同步检查

五、能力等级自评(D1~D5)

以下对照五维度能力框架,评估本项目已落地的 Vibe Coding 能力等级:

D1 技术编码(Coding & Implementation)

等级可观察行为锚点本项目达标情况
L1AI 补全、单文件生成、正则/SQL/CRUD✅ 基础能力
L2多轮对话完成完整模块、单元测试 ≥60%、代码摘要✅ 已落地
L3拆解需求为 sub-task、Plan-Mode 串联、多模型择优✅ SDD + 编排器
L4定制 Lint/Test/Review Agent、跨服务重构、测试覆盖 ≥80%部分达标(有 Review 角色 + 测试门禁,跨服务重构待验证)
L5集团级 AI 编码范式、项目级重写🔲 未达

当前评估:L3~L4

D2 工程方法(SDD / Eval / Agentic Workflow)

等级可观察行为锚点本项目达标情况
L1列 TODO、AI 自查、知道 Plan/Agent 区别✅ 基础能力
L2写 spec.md、端到端验证、切换 Plan/Agent/Ask✅ 已落地
L3SDD 模式(spec→plan→tasks→impl→eval)、Eval 用例✅ 完整 SDD 四阶段
L4团队级 Eval 流水线、SDD 规范落地、多 Agent 编排已达标(编排器 + 六角色 + 看板 + 轨迹)
L5集团 AI-SDLC 标准🔲 未达

当前评估:L4

D3 上下文工程(Context Engineering)

等级可观察行为锚点本项目达标情况
L1知道 rules/AGENTS.md、@文件、知道 Skills✅ 基础能力
L2写自用 Rule、调用 Skill、@Past Chats/@Web✅ 已落地
L3编写可复用 Skill、配置 Hooks、管理项目/全局 Rule✅ 7 大 Skill + 5 Hook + 10 Rule
L4部门级 Skill/Rule 仓库、集成 MCP Server、Memory/图谱方案部分达标(Graphify 图谱 + MCP 集成,仓库化待推广)
L5集团级上下文治理规范🔲 未达

当前评估:L3~L4

D4 安全与治理(Safety / Privacy / IP / Cost)

等级可观察行为锚点本项目达标情况
L1密钥不进 git、不粘贴客户数据、知道幻觉✅ 基础能力
L2识别安全漏洞、Lint + 静态扫描、.gitignore✅ 已落地
L3防御 Prompt Injection、工具白名单、Token 成本控制已达标(Git 最严约束 + Hook 门禁 + 安全自检)
L4LLM 可观测性、模型审计、数据分级🔲 待建设
L5集团红队测试🔲 未达

当前评估:L3

D5 组织赋能(Mentor / Knowledge / Culture)

等级可观察行为锚点本项目达标情况
L1分享 AI 用法、演示工具配置✅ 基础能力
L21 对 1 答疑、个人最佳实践笔记✅ 已落地
L3内部分享、复用产物被 ≥3 人采用、AI 周会/周报部分达标(模板 + 看板 + 轨迹可视化,推广中)
L4部门 AI 提效专项、方法论文档🔲 待推进
L5行业分享、培养 L4🔲 未达

当前评估:L3


六、能力雷达图

24%21%21%18%18%五维度能力等级(满分 L5)D1 技术编码 (L3.5)D2 工程方法 (L4)D3 上下文工程 (L3.5)D4 安全与治理 (L3)D5 组织赋能 (L3)

七、核心优势总结

优势体现
规范先行所有实施必经 Spec → Plan → Tasks → Implement,禁止跳过
多层硬门禁Git 授权、编码前检查、安全自检,环环相扣
知识图谱驱动Graphify 主动维护项目上下文,未命中强制入图
真实 Agent 编排多角色并发派发,严格依赖与冲突检查
实时可视化任务看板 + 会话轨迹,支持事后回溯
安全贯穿全程设计→实现→测试→部署,每步有检查点
可复用可扩展模板、看板、轨迹全部机器可读,支持跨项目复制

八、文件索引

分类关键文件说明
核心配置CLAUDE.md项目总览与入口指针
.cursor/rules/10 条分层规则
.cursor/skills/7 大技能分类
.cursor/hooks.jsonHook 触发配置
.cursor/mcp.jsonMCP 服务配置
流程定义.cursor/skills/30-orchestrators/SDD 编排器
.cursor/skills/20-capabilities/30-sdd-workflow/四阶段手册
.cursor/skills/00-router-skill/路由与图谱
任务管理.cursor/trajectories/current-task-board.json实时看板
.cursor/templates/文档模板库
运维工具.cursor/check-claude-sync.ps1结构同步检查
.cursor/hooks/5 个自动化脚本
知识库graphify-out/graph.json知识图谱
docs/specs/功能规格
docs/change/变更文档
docs/plans/技术方案
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值