当 AI 读懂了每一行源码,运维诊断就有了新答案。
一次故障排查,到底要花多少时间?
运维人员在面对私有云、虚拟化平台的使用问题时,典型的处理流程是这样的:先翻日志看现象,再去文档里找对应机制,然后搜社区看有没有类似案例,最后综合判断给出答复。简单问题半小时,复杂问题可能要跨天——而这些时间里,大部分花在了"找信息"而不是"做决策"上。
这样的问题,可能每天都在你身边发生:
场景1:"日志里反复出现一条告警提醒,系统跑得好好的,这条到底要不要处理?"
场景2:"集群里有虚拟机触发了 HA 自动迁移,它是按什么条件判定的?相关的判定阈值和默认值又是怎么设定的?"
场景3:"从 V4 升级到 V5 之后,某个接口的行为有了变化,需不需要做进一步的配置来适配?"
过去这些都要工程师手动翻查、逐一确认。如果有一个工具,能自动读完源码、查完文档、翻完社区历史案例,把分析结果和证据链直接摆在你面前呢?
我们做了什么
ZStack 源码级 AI 诊断套件——一套专为 ZStack 云平台日常运维场景设计的专家技能包。它不是给通用 AI 套层壳,而是一套由多个 Sub-Agent 协同工作的深度集成诊断引擎:
直接读源码 — 通过 GitHub MCP 连接器,实时查询 (zstackio/zstack )和 (zstackio/zstack-utility )两大开源仓库,从代码层面解释产品机制
自动查文档 — 内置 ZStack 官网文档 V4/V5 双版本章节索引,精准定位到具体章节页
历史案例匹配 — 通过 BBS MCP 连接器检索 ZStack 知识社区的历史帖子,找到相似症状和已验证的处理方案
证据分级体系 — 内置 E0-E5 六级证据标准和 4 类结论标签(已确认/很可能/可能/待补证据),每条结论都有据可查
一句话:它把资深工程师的诊断思路,变成了可复用的自动化流程。
当前支持什么
套件包含 6 项专业技能,覆盖从问题接入到结论输出的完整链路:
|
技能 |
说明 |
|---|---|
| @事件分析 |
核心技能。粘贴日志或错误描述,自动完成证据收集、源码查证、文档查阅、社区参考和闭环决策的全流程诊断 |
| @源码查证 |
独立查询 ZStack 开源代码解释产品机制,支持版本感知——精确定位到客户运行版本的代码分支 |
| @交接摘要 |
一键生成可安全对外交付的交接文档,含问题摘要、影响范围、证据链和下一步行动 |
| @脱敏检查 |
逐项检查凭证、内部 URL、客户原始数据等敏感信息,确保输出可安全分享 |
| @连通检查 |
渐进式冒烟检测,验证 GitHub 和 BBS 连接器是否正常可用 |
| @知识库 |
内置工作流方法论、案例模板和安全策略,后台自动引用 |
在 2026 年 6 月 25 日发布的最新版本(v3.1.0)中,套件采用三路并行查证架构——同时启用 3 个 Sub-Agent 并行检索 GitHub 源码、官方文档与 BBS 社区,交叉验证后汇总输出,让整体诊断效率大幅提升。
它能带来什么
对客户:提交工单后等待时间更短、拿到的分析报告更专业。不再是"可能是什么问题"的猜测,而是带着源码证据、文档引用和历史案例参考的结构化诊断结论。问题的定位和处理方案都有据可查,沟通效率大幅提升。
对渠道和服务伙伴:拥有一套标准化的诊断方法论。E0-E5 证据分级和 4 类结论标签成为通用语言,不同工程师的分析报告质量一致、可对比、可交接。脱敏检查和交接摘要功能确保输出给客户的文档安全可靠。合作伙伴申请 BBS 权限后可解锁全部能力。
两个版本
套件当前首发运行在 QoderWork 平台,提供两个版本:

这只是开始
首发平台之外,这套 AI 诊断套件未来会接入更多平台、覆盖更多使用场景,也会支持更多的桌面 Agent 工具。
我们需要你的声音
你最希望 AI 帮你解决什么运维问题?还需要哪些诊断套件?
-
• 在评论区留言,或加入上方的交流群直接反馈
-
• 每一个需求都会被认真评估,优先级最高的方向进入下一轮开发

2746

被折叠的 条评论
为什么被折叠?



