你的Claude Code到底用对了没?用内置诊断报告来一探究竟!

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

某编程助手有个鲜为人知的功能,即/insights。

该功能会深度剖析你的全部会话记录,产出一份近似于复盘总结的材料,让你明了近期工作进展、瓶颈所在,以及后续的优化方向。

90a60fe4-0aa8-4cca-b411-37c6b0601f84.png

我亲自跑了个测试,结果拿来与大家分享。

如何使用

在助手界面中直接键入:

/insights

77b34e8d-aab7-46f1-a6e3-de0cc274101d.png

激活此指令后,系统将扫描本地全部对话历史,从消息数、工具调用频次、错误类别及满意度等多个维度进行分析。

稍等片刻,它便会生成一份纯HTML格式的本地化结构报告。

我的数据报告概览

我的这份报告时间跨度为6天,从2026年4月28日至5月3日。

900faf20-be59-4214-8120-6fe25141dfe4.png

基础数字

总计80个会话,包含810条消息
日均消息量约为135条
期间触及272个文件,代码量净增长21292行

工具使用排行

Bash工具调用高达2332次,Read操作为697次,而Edit操作是451次。

0e63a0b3-9639-41bf-92bc-af003e39a614.png

这与我的实际使用情况完全相符,我主要用它执行脚本、读取文件和修改代码,而非闲聊。

编程语言的分布情况:TypeScript涉及424个文件,Go语言260个,Rust则有166个,Python为64个,这与我实际的工作内容高度匹配。

在会话类型分布中,名为“Multi Task”的类别占据了17个,其含义是在单次会话中处理多个不相干任务,这也恰好反映了我为单个项目开启多个窗口的工作习惯。

说到底人非机器,有时我甚至会开玩笑,觉得人类的“上下文窗口”恐怕都到不了128K,毕竟刚收到的验证码转头就忘是常有的事。

因此,为单个项目开启超过四个窗口,效率或许并不理想。

它觉得我做得好的地方

报告中设有一个“Impressive Things”的特别板块,罗列了它认为值得称道的几项正确用法:

9ee18cda-9b07-4560-9a1b-251fd1b504f9.png

其一,是关于CLI工具的改造。

在五一假期期间,我动手编写了一个名为aiswitch的命令行工具,用于切换不同的模型供应商。

我委托它为aiswitch工具添加了八项新功能,涵盖了搜索、光标操控、token可见性调整、滚动、Shell自动补全、连接性测试、重复项检测以及配置备份。

借助国产的GLM-5.1模型,整个过程基本是一次性规划、分步实施,全程相当平顺,未出现重大波折。

假期这段时间体验下来,发现GLM-5.1用起来出奇地顺手,既快又好,主观感受在某些场景下甚至优于opus。这让我觉得,国产大模型若能持续发力,追赶上国外顶级模型并非没有可能。

其二,则是全栈部署的自动化实践。

报告记录了一次网站部署经历,当时遇到了DNS/CDN冲突及Nginx路由的难题,最终由AI助手自行排查并解决,我仅在最后阶段核对了最终结果。

它觉得我哪里有问题

报告将我遇到的问题归纳为三大类别。

5ac466b2-3212-49b4-8cac-dd9e498171d8.png

类别一:工具与API集成失败。

在某次会话中,我尝试用Python调用Ollama的API,不料urllib遭遇超时,改用subprocess执行curl又撞上沙箱限制,再换http.client则出现阻塞,前后折腾了四种方案才最终成功。

这份报告不仅记录了此事,还贴心地给出了改进建议。

建议下次优先尝试requests库,若不成功再切换至curl,再不行则考虑MCP Server,避免每次都从零开始摸索。

类别二:需求描述含糊不清。

例如有一次,我需要实现一个双击Esc键的交互:单击用于解锁,而双击则是退出。但AI助手却误解为两种操作都是退出,导致反复折腾了好几回。

这确实是我的表述问题,需求描述得不够精准。

类别三:环境配置出现意外。

9cbcd58f-0d70-4ca9-b82e-97f90a322212.png

用Python 3.10安装的依赖包,在Python 3.14的测试环境中运行时直接报错。此外,包的配置路径使用了相对路径,导致更换目录后立即失效。

此类问题通常依赖经验来规避,报告据此建议在启动任何部署任务前,都应先执行一次版本检查。

用户满意度分析

报告中包含一项推断出的用户满意度分布图:

d1ac74f9-ee86-4fa0-886e-e432f9b7b889.png

换算下来,约有九成的会话达到了满意状态,这个比例超出了我的预期。

当然,这份报告也并非百分之百精准。例如,它指出我在6天内仅有2次git commit,这可能是因为我通过自定义Skill提交,而该行为未被完整监测到。

报告提供的优化建议

这部分内容可以说价值连城。

针对我的使用模式,报告推荐了以下几项具体调整:

首先,将重复性工作流程封装为自定义技能(Custom Skills)。

我频繁执行的任务,诸如发布文章至CMS、上传文件、新建GitHub仓库等,都有固定的步骤。这些完全可以封装成 /publish-article、/upload、/github-repo 之类的 /command 指令,实现一键调用,省去每次重复描述的麻烦。

其次,增加Hooks来进行前置检查。

在每次会话启动前,自动运行 python3 --version 和 pnpm --version,从而能及早暴露版本不匹配的问题,避免任务执行到一半才发现异常。

第三,为API集成准备多种备用方案。

今后处理任何与HTTP请求相关的任务时,应预先备好 requests、curl、MCP Server 这三套方案,一旦某条路径受阻,便能迅速切换,而不是在单一方案上反复纠结调试。

总而言之,/insights功能的核心价值,在于它能从你数十个会话中提炼并总结出你的行为模式。

它让你洞察到平时难以察觉的隐性问题,例如哪类任务频繁受阻,何种需求描述方式易引发误解,以及哪些工作流程最值得被固化为快捷命令。

借由insights进行的周期性复盘,我们得以持续地发现、纠正并改进那些被忽略的问题,并将固化的重复流程转化为高效的技能。

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值