大家好,我是玄姐。
PS:
企业级 SDD AI 编程应用落地案例干货直播,欢迎点击预约,直播见。
导读: 随着基座模型(LLM)推理能力的跃升,Claude Code、OpenClaw、Hermes Agent 等全新一代智能体系统相继爆发。Agent 已经从早期的“魔法 Prompt 调优”走向系统性的“智能体工程”。

本文将深度拆解 Agent 四大发展阶段,并对六个核心技术维度的前沿演化与底层工程思考进行对比复盘。
一、 四阶演进:从被动响应到自进化系统
纵观 2023 至 2026 年的行业实践,Agent 的技术形态并未遵循线性路径,而是经历了解耦、工程化约束、自主长程以及持续学习的四个关键代际。

[阶段 1: ReAct 被动式] ──> [阶段 2: Workflow 刚性编排] ──> [阶段 3: 自主长程 Agent] ──> [阶段 4: 自进化 Agent] (模型原生/单点任务) (硬约束/弥补不确定性) (Spec驱动/复杂规划) (数据沉淀/RL自我升级)1.阶段一:早期被动式 Agent(ReAct 范式)以 2023 年 Lilian Weng 的经典定义(LLM + Planning + Memory + Tools)为起点。这一时期的 Agent 采用朴素的 ReAct(Reasoning + Acting)环路,遵循单步的 Reasoning → Action → Observation → Response 链条。
局限:受限于当时模型的推理深度,多轮推理极易中断。系统呈“无状态、一问一答”的单点交互,无法处理长链路的复杂任务。
2. 阶段二:工作流 Agent(结构化与可控性)
2024 年,面对 to B 业务对稳定性的极致追求,Agentic Workflow 成为主流。
本质:用工程化的“硬编码”流程去约束模型的不确定性。这是驾驭层(Harness)约束工程的早期萌芽。大模型在固定的有向无环图(DAG)节点中扮演单点决策者,牺牲了一定的灵活性,换取了企业级资产的确定性。
3. 阶段三:自主 Agent(复杂规划与长程任务)
2025 至 2026 年,以 Claude Code、OpenClaw 为代表的自主智能体(Autonomous Agent)标志着能力的第二次飞跃。
特征:面对模糊需求,Agent 能够自主进行跨时域的 Planning,将其拆解为结构化的任务树(Task Graph),并基于Specification-Driven Development (SDD,规范驱动开发)连续运行。模型从“辅助调取工具的 Chatbot ”转变为“交付最终结果的数字员工”。
4. 阶段四:自进化 Agent(持续学习与自我升级)
以 Hermes Agent 等最新框架为代表,2026 年 Agent 进入自进化(Self-Evolving)时代。
核心:解决静态模型与动态现实之间的矛盾。Agent 在执行长程任务中不仅是“消耗资源”,而是在同步沉淀经验(Skills)与知识。通过环境反馈与强化学习(RL)闭环,实现“越用越好用”的资产化跃升。
二、 核心技术范式的六大颠覆性转变
在具体实现层面,构成 Agent Loop 的六个核心技术轴线正发生着从“软调优”到“硬工程”的本质解耦。
1. Prompt 提示词:由“单体紧耦合”向“渐进式上下文加载”演进

早期为了特定场景不得不采用“一个任务配置一个 Agent”的烟囱式开发,System Prompt 沦为包含人设、约束、示例的千字“大作文”,极难维护。
新范式:动静分离与模块化。
最新的架构将底层 System Prompt 彻底固化和轻量化,仅保留核心的行为准则(Harness 根指令)。而将动态的领域知识、任务规范(如 USER.md、SOUL.md)以及具体任务的执行方法论解耦为独立的 Markdown 技能文件(如 SKILL.md)。在运行期间,通过文件系统进行渐进式披露与动态加载,极大降低了维护成本并节省了基础 Token 消耗。
2. Planning 规划:由“线性思维链 (CoT)”向“长程结构化拆解”演进

过去模型推理能力弱,规划主要依赖在 Prompt 中加入 “Let's think step by step” 等软技巧,引导模型进行单线串行推导,极易掉链。
新范式:Task Graph 与动态子 Agent 实例化。
得益于新一代基座模型原生 Reasoning 能力的质变,当下的 Planning 演变为真正的智能决策中枢:
结构化拆解: 自动将复杂宏观目标拆解为动态更新的 Todo List。
动态路由与嵌套:决策中枢根据子任务的边界,在运行时动态实例化或挂载特定的子 Agent(Master-Slave 架构),形成协同作战。
3. Memory 记忆:由“前置 RAG 检索”向“文件系统化混合管理”演进

经典架构将记忆简单划分为短期上下文与长期向量检索(RAG)。面对超长程任务,这种粗暴的划分导致上下文爆炸或检索失准。
新范式:精炼压缩与文件系统化重构。
| 维度 | 演进前 (2023-2024) | 演进后 (2025-2026) |
|---|---|---|
| 短期记忆 | 简单堆砌全量历史对话(History Lines) | 基于语义密度的结构化摘要与事实状态提取(动态压缩) |
| 事项记忆 | 依赖向量数据库检索 | 沉淀为可控、可读的文件系统(如 MEMORY.md 日志) |
| 知识记忆 | 纯向量检索(纯 RAG) | 本地文件系统(LLM-Wiki/Markdown 库) + 轻量级向量(SQLite/QMD)混合检索 |
思考: 纯向量检索在长程任务中具备不可控性。回归“文件系统即记忆”的模式,赋予了开发者通过目录、标签和显式时间线来调试和干预 Agent 记忆资产的能力。
4. Tools 工具调用:由“Function Calling 适配”向“CLI / Script 原生化”演变
Function Calling 要求开发者为每个工具编写严苛的 API Schema 描述,维护成本极高,且遇到未定义的场景系统即刻瘫痪。
新范式:利用大模型的“先天计算机知识”(CLI + Script)。
CLI(命令行界面)成为天然工具: 对于人类高门槛的 Linux 命令(如 grep, cat, sed),对大模型而言是完美的标准预训练知识。模型可以通过操作 CLI 运行时来查阅 --help 文档,展现出“按需查询、即时学习”的零样本泛化能力。
Script 脚本化: 将复杂的第三方鉴权、多步 API 拼接封装在独立的 Python/Shell 脚本(Resources)内。Agent 仅需理解“调用该脚本并传入核心参数”,将协议黑盒化,极大降低了模型的认知负载。
5. Workflow 工作流:由“外置刚性编排”向“动态混合封装”演进

早期为了解决模型不确定性,使用 LangGraph 或 Dify 将流程锁死在硬编码的状态机中。
新范式:Skill 内聚化与混合驾驭。
流程的硬控制逻辑正内化至 Skill 描述文件和配套的自动化脚本中。在企业落地中,主流架构已演变为混合架构:
主干流程: 依然保留确定性的刚性 Workflow 或 Script 级硬约束,确保业务下限。
分支与弹性任务: 封装为高度内聚、可动态组合的 Skills,交给 Agent 自由发挥,最大化释放智能上限。
6. Environment 运行环境:由“无状态调用”向“持久化运行时沙箱 (Runtime)”重构

早期的 Agent 属于“空中楼阁”,其调用通常是无状态的,不需要关心物理环境。
新范式:有状态的数字员工工作空间(Workspace)。
由于当代 Agent 频繁涉及文件读写、环境配置和代码编译执行,隔离的运行时环境(Runtime)成为基础设施:
企业端: 采用基于 Docker / Kubernetes / Modal 的安全沙箱,将 Agent 所有的破坏性潜力隔离在虚拟文件系统内,提供完善的凭证传递与审批引擎(Human-in-the-loop)。
个人端: 本地 Workspace 模式(如 OpenClaw),直接挂载本地目录,通过严格的权限边界控制提供高生产力协助。
三、 总结:从“系统魔法”到“系统工程”
Agent 架构历经数年演变,“形”未变(依然是 Prompt、Planning、Memory、Tools 的组合),但“神”已大不同。
┌──────────────────────────────────────┐ │ Harness Layer (驾驭层工程) │ │ (Sandbox / Spec / Custom Markdown) │ └──────────────────┬───────────────────┘ │ 控制/约束 ▼┌─────────────────────────────────────────────────────────────────────────┐│ Agent Core Loop ││ [Prompt 渐进式] ──> [Planning 任务树] ──> [Memory 文件化] ──> [Tools CLI] │└─────────────────────────────────────────────────────────────────────────┘
这场重构的本质,是业界不再寄希望于仅靠提升模型的“智商(提示词微调)”去生硬地解决所有现实复杂问题,而是开始沉淀一套通过系统工程化的确定性(Harness 驾驭层),去承载并放大模型不确定性(LLM 推理)的科学方法论。理解这一范式转移,是我们在当下纷繁的技术浪潮中,做对企业级工业落地技术选型的关键基石。
PS:
企业级 SDD AI 编程应用落地案例干货直播,欢迎点击预约,直播见。
好了,这就是我今天想分享的内容。如果你对构建企业级 AI 原生应用新架构设计和落地实践感兴趣,别忘了点赞、关注噢~
—1—
加我微信
扫码加我👇有很多不方便公开发公众号的我会直接分享在朋友圈,欢迎你扫码加我个人微信来看👇

加星标★,不错过每一次更新!
⬇戳”阅读原文“,立即预约!


412

被折叠的 条评论
为什么被折叠?



