从 Vibe Coding 到 Harness 工程：Agent 核心范式的4阶架构演进与6大技术重构

最新推荐文章于 2026-06-20 11:16:21 发布

原创最新推荐文章于 2026-06-20 11:16:21 发布 · 571 阅读

13 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#架构 #重构

大家好，我是玄姐。

PS：

企业级 SDD AI 编程应用落地案例干货直播，欢迎点击预约，直播见。

导读： 随着基座模型（LLM）推理能力的跃升，Claude Code、OpenClaw、Hermes Agent 等全新一代智能体系统相继爆发。Agent 已经从早期的“魔法 Prompt 调优”走向系统性的“智能体工程”。

本文将深度拆解 Agent 四大发展阶段，并对六个核心技术维度的前沿演化与底层工程思考进行对比复盘。

一、四阶演进：从被动响应到自进化系统

纵观 2023 至 2026 年的行业实践，Agent 的技术形态并未遵循线性路径，而是经历了解耦、工程化约束、自主长程以及持续学习的四个关键代际。

[阶段 1: ReAct 被动式] ──> [阶段 2: Workflow 刚性编排] ──> [阶段 3: 自主长程 Agent] ──> [阶段 4: 自进化 Agent]   (模型原生/单点任务)          (硬约束/弥补不确定性)          (Spec驱动/复杂规划)          (数据沉淀/RL自我升级)

1.阶段一：早期被动式 Agent（ReAct 范式）

以 2023 年 Lilian Weng 的经典定义（LLM + Planning + Memory + Tools）为起点。这一时期的 Agent 采用朴素的 ReAct（Reasoning + Acting）环路，遵循单步的 Reasoning → Action → Observation → Response 链条。

局限：受限于当时模型的推理深度，多轮推理极易中断。系统呈“无状态、一问一答”的单点交互，无法处理长链路的复杂任务。

2. 阶段二：工作流 Agent（结构化与可控性）

2024 年，面对 to B 业务对稳定性的极致追求，Agentic Workflow 成为主流。

本质：用工程化的“硬编码”流程去约束模型的不确定性。这是驾驭层（Harness）约束工程的早期萌芽。大模型在固定的有向无环图（DAG）节点中扮演单点决策者，牺牲了一定的灵活性，换取了企业级资产的确定性。

3. 阶段三：自主 Agent（复杂规划与长程任务）

2025 至 2026 年，以 Claude Code、OpenClaw 为代表的自主智能体（Autonomous Agent）标志着能力的第二次飞跃。

特征：面对模糊需求，Agent 能够自主进行跨时域的 Planning，将其拆解为结构化的任务树（Task Graph），并基于Specification-Driven Development (SDD，规范驱动开发)连续运行。模型从“辅助调取工具的 Chatbot ”转变为“交付最终结果的数字员工”。

4. 阶段四：自进化 Agent（持续学习与自我升级）

以 Hermes Agent 等最新框架为代表，2026 年 Agent 进入自进化（Self-Evolving）时代。

核心：解决静态模型与动态现实之间的矛盾。Agent 在执行长程任务中不仅是“消耗资源”，而是在同步沉淀经验（Skills）与知识。通过环境反馈与强化学习（RL）闭环，实现“越用越好用”的资产化跃升。

二、核心技术范式的六大颠覆性转变

在具体实现层面，构成 Agent Loop 的六个核心技术轴线正发生着从“软调优”到“硬工程”的本质解耦。

1. Prompt 提示词：由“单体紧耦合”向“渐进式上下文加载”演进

早期为了特定场景不得不采用“一个任务配置一个 Agent”的烟囱式开发，System Prompt 沦为包含人设、约束、示例的千字“大作文”，极难维护。

新范式：动静分离与模块化。

最新的架构将底层 System Prompt 彻底固化和轻量化，仅保留核心的行为准则（Harness 根指令）。而将动态的领域知识、任务规范（如 USER.md、SOUL.md）以及具体任务的执行方法论解耦为独立的 Markdown 技能文件（如 SKILL.md）。在运行期间，通过文件系统进行渐进式披露与动态加载，极大降低了维护成本并节省了基础 Token 消耗。

2. Planning 规划：由“线性思维链 (CoT)”向“长程结构化拆解”演进

过去模型推理能力弱，规划主要依赖在 Prompt 中加入 “Let's think step by step” 等软技巧，引导模型进行单线串行推导，极易掉链。

新范式：Task Graph 与动态子 Agent 实例化。

得益于新一代基座模型原生 Reasoning 能力的质变，当下的 Planning 演变为真正的智能决策中枢：

- 结构化拆解：自动将复杂宏观目标拆解为动态更新的 Todo List。
- 动态路由与嵌套：决策中枢根据子任务的边界，在运行时动态实例化或挂载特定的子 Agent（Master-Slave 架构），形成协同作战。

3. Memory 记忆：由“前置 RAG 检索”向“文件系统化混合管理”演进

经典架构将记忆简单划分为短期上下文与长期向量检索（RAG）。面对超长程任务，这种粗暴的划分导致上下文爆炸或检索失准。

新范式：精炼压缩与文件系统化重构。

维度	演进前 (2023-2024)	演进后 (2025-2026)
短期记忆	简单堆砌全量历史对话（History Lines）	基于语义密度的结构化摘要与事实状态提取（动态压缩）
事项记忆	依赖向量数据库检索	沉淀为可控、可读的文件系统（如 MEMORY.md 日志）
知识记忆	纯向量检索（纯 RAG）	本地文件系统（LLM-Wiki/Markdown 库） + 轻量级向量（SQLite/QMD）混合检索

思考： 纯向量检索在长程任务中具备不可控性。回归“文件系统即记忆”的模式，赋予了开发者通过目录、标签和显式时间线来调试和干预 Agent 记忆资产的能力。

4. Tools 工具调用：由“Function Calling 适配”向“CLI / Script 原生化”演变

Function Calling 要求开发者为每个工具编写严苛的 API Schema 描述，维护成本极高，且遇到未定义的场景系统即刻瘫痪。

新范式：利用大模型的“先天计算机知识”（CLI + Script）。

- CLI（命令行界面）成为天然工具：对于人类高门槛的 Linux 命令（如 grep, cat, sed），对大模型而言是完美的标准预训练知识。模型可以通过操作 CLI 运行时来查阅 --help 文档，展现出“按需查询、即时学习”的零样本泛化能力。
- Script 脚本化：将复杂的第三方鉴权、多步 API 拼接封装在独立的 Python/Shell 脚本（Resources）内。Agent 仅需理解“调用该脚本并传入核心参数”，将协议黑盒化，极大降低了模型的认知负载。

5. Workflow 工作流：由“外置刚性编排”向“动态混合封装”演进

早期为了解决模型不确定性，使用 LangGraph 或 Dify 将流程锁死在硬编码的状态机中。

新范式：Skill 内聚化与混合驾驭。

流程的硬控制逻辑正内化至 Skill 描述文件和配套的自动化脚本中。在企业落地中，主流架构已演变为混合架构：

主干流程：依然保留确定性的刚性 Workflow 或 Script 级硬约束，确保业务下限。
分支与弹性任务：封装为高度内聚、可动态组合的 Skills，交给 Agent 自由发挥，最大化释放智能上限。

6. Environment 运行环境：由“无状态调用”向“持久化运行时沙箱 (Runtime)”重构

早期的 Agent 属于“空中楼阁”，其调用通常是无状态的，不需要关心物理环境。

新范式：有状态的数字员工工作空间（Workspace）。

由于当代 Agent 频繁涉及文件读写、环境配置和代码编译执行，隔离的运行时环境（Runtime）成为基础设施：

企业端：采用基于 Docker / Kubernetes / Modal 的安全沙箱，将 Agent 所有的破坏性潜力隔离在虚拟文件系统内，提供完善的凭证传递与审批引擎（Human-in-the-loop）。
个人端：本地 Workspace 模式（如 OpenClaw），直接挂载本地目录，通过严格的权限边界控制提供高生产力协助。

三、总结：从“系统魔法”到“系统工程”

Agent 架构历经数年演变，“形”未变（依然是 Prompt、Planning、Memory、Tools 的组合），但“神”已大不同。

┌──────────────────────────────────────┐                    │       Harness Layer (驾驭层工程)      │                    │  (Sandbox / Spec / Custom Markdown)  │                    └──────────────────┬───────────────────┘                                       │ 控制/约束                                       ▼┌─────────────────────────────────────────────────────────────────────────┐│                          Agent Core Loop                                ││  [Prompt 渐进式] ──> [Planning 任务树] ──> [Memory 文件化] ──> [Tools CLI] │└─────────────────────────────────────────────────────────────────────────┘

这场重构的本质，是业界不再寄希望于仅靠提升模型的“智商（提示词微调）”去生硬地解决所有现实复杂问题，而是开始沉淀一套通过系统工程化的确定性（Harness 驾驭层），去承载并放大模型不确定性（LLM 推理）的科学方法论。理解这一范式转移，是我们在当下纷繁的技术浪潮中，做对企业级工业落地技术选型的关键基石。

PS：

企业级 SDD AI 编程应用落地案例干货直播，欢迎点击预约，直播见。

好了，这就是我今天想分享的内容。如果你对构建企业级 AI 原生应用新架构设计和落地实践感兴趣，别忘了点赞、关注噢~

—1—

加我微信

扫码加我👇有很多不方便公开发公众号的我会直接分享在朋友圈，欢迎你扫码加我个人微信来看👇