多 Agent 系统设计参考框架(OpenClaw 实现版)

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

多 Agent 系统设计参考框架(OpenClaw 实现版)

在这里插入图片描述

〇、基础概念三层

概念定义OpenClaw 对应一句话
LLM大语言模型本身,只能单次回答可接入的模型(DeepSeek/Claude/GPT 等)会说的“脑子”
Agent带有目标、工具、记忆、能循环行动的 AI 程序OpenClaw 中的 Agent(由 SOUL.md 定义)会做事的“员工”
Workflow定义多个 Agent/Nodes 的执行顺序、条件、失败处理通过路由规则 (bindings) 和消息通道 (sessions_send) 编排管流程的“规章”

一切多 Agent 架构,本质上是把多个 Agent 按某种 Workflow 组织起来。


一、静态结构:以 OpenClaw 为例的嵌套模型

部署环境 (单机 / 集群 / 云)
  └─ OpenClaw 实例 (Instance) —— 一个操作系统进程,拥有独立内存空间
       └─ 网关 (Gateway) —— 绑定一个端口,消息的唯一出入口
            └─ Agent —— 拥有独立 SOUL、记忆、工作目录的 AI 个体
                 └─ 会话 (Session) —— 单次对话的上下文容器
概念准确定义关键约束
部署环境Agent 系统运行的物理或虚拟载体单机、多机集群、云主机、容器集群等
实例一个运行中的 OpenClaw 进程拥有 OS 隔离的独立内存空间;不同实例在进程层互不可达
网关实例内的消息路由层一个实例一个主网关,绑定一个端口;多实例不可共占同一端口
Agent拥有独立 SOUL.md、记忆、工作目录的 AI 单元同一实例内可存在多个;互相知晓;上下文严格隔离
会话单次对话的上下文容器归属唯一 Agent;结束后记忆可选择保留

层级关系:一个网关下可以有 N 个 Agent;每个 Agent 下有 N 个会话。

单实例多 Agent 示例:
┌──────────────────────────────────────────┐
│  网关 (Gateway)                          │
│  一个进程,绑定一个端口                    │
│  例:gateway @ 127.0.0.1:18789           │
│  ──────────────────────────────────────  │
│                                          │
│  ├── Agent: alice                        │
│  │   ├── 工作目录: /workspace/alice/      │
│  │   │   ├── SOUL.md                     │
│  │   │   ├── USER.md                     │
│  │   │   ├── TOOLS.md                    │
│  │   │   └── memory/                     │
│  │   ├── 模型: DeepSeek                  │
│  │   ├── 会话: Session A                 │ ← 实例化的对话
│  │   └── 会话: Session B (后台 spawn)    │
│  │                                      │
│  ├── Agent: scout                       │
│  │   ├── 工作目录: /workspace/scout/     │
│  │   ├── 模型: DeepSeek                  │
│  │   └── 会话: Session C                 │
│  │                                       │
│  └── Agent: ...                          │
└──────────────────────────────────────────┘

二、隔离光谱:L1–L6 部署层级

硬隔离 ←——————————————————————————————————————————————————————————→ 软协作
 L1            L2          L3          L4          L5          L6
物理隔离     虚拟化隔离   容器化隔离   多实例隔离   同网关多Agent  单Agent多角色
层级部署方式隔离机制实例数网关数Agent 间感知典型场景
L1多台物理设备各运行 OpenClaw物理断网NN红蓝对抗完全分离
L2单设备多 VM 各运行 OpenClaw独立 OS/内核/网络栈NN需独立 IP 的安全任务
L3单设备多容器各运行 OpenClaw共享内核,命名空间隔离NN可配轻量快速部署销毁
L4单 OS 多 OpenClaw 实例进程级隔离NN(各占端口)❌ 互不知晓一机服务多客户互盲
L5单实例多 Agent应用层上下文隔离11✅ 互相知晓团队内部分工协作
L6单实例单 Agent 多角色无架构隔离,纯提示词切换11N/A个人临时角色扮演

核心原则:隔离级别越向左,安全性越高,协作成本越高;越向右,协作越顺,但风险越集中。


三、单机三种部署基元

方案实例数Agent/实例网关数Agent 感知映射层级本质描述
方案 1111N/AL6最简基元:openclaw agents add main
方案 21N1✅ 互相知晓L5内部协作:通过 sessions_send 通信
方案 3N1N(各占端口)❌ 默认互不知晓L4完全隔离:多实例各占独立端口

方案 3 扩展: 可通过反向代理、Redis 消息队列、通信中继等外部手段使多个实例的 Agent 互相感知和通信——集群通信的起点。


四、通信机制

通信距离对应方案OpenClaw 通信机制关键特征
同屋檐 (同一实例)方案 2 / L5sessions_send 内部消息通道极低延迟,不需网络
同小区 (同机不同实例)方案 3 / L4本地 HTTP API / 本地 Redis MQ需主动调用或投递
天南海北 (多机集群)L1–L3 + 网络网络 Redis/Kafka MQ / 通信中继异步解耦,需寻址与容错

五、拓扑与协作:双维度的正交“排兵布阵”

5.1 六大拓扑结构

拓扑结构优点缺点OpenClaw 实现方式
平行式并列,互不通信绝对隔离无协作方案 3:多实例互盲
星型式一处中枢,多卫星控制集中,易管理中枢单点故障一个 Planner Agent 通过 sessions_send 调度多个子 Agent
流水线式A→B→C 链式流程清晰,易调试僵化,一步卡全停各 Agent 通过 sessions_send 依次传递产物
接力式Agent 主动转移任务给更合适的 Agent去中心,专业匹配需清晰转移协议Agent 判断任务类型后 sessions_send 给专职 Agent
网状式任意点对点灵活,容错消息风暴,难治理所有 Agent 间开放 sessions_send 权限
层级式多级星型嵌套可扩展,权责分明深层次延迟,顶层风险队长 Agent 下挂多个小组 Agent,各组再管队员

5.2 四大协作对话模式

模式机制方向驱动类型
委派执行主 Agent 派任务,等结果单向动作驱动 (动词)
招标投标发布任务,多 Agent 竞标多对一动作驱动
协商辩论多观点碰撞,达成共识双向/多向动作+思维驱动
广播同步一对多发布状态更新一对多动作驱动

拓扑与协作正交,可任意组合。 同时必须搭配产物流转(名词驱动):传递结构化产物(Spec、报告、验收单),而非仅仅定义"谁对谁说话"。


六、认知协作

6.1 三种认知子模式

子模式机制通用场景举例
串联式A→B→C 链式接力,允许驳回初诊→专家会诊→处方审核
辩论式并行输出→互相挑战投资决策多因子辩论
金字塔式并行收集→汇总提炼→统一报告多渠道舆情分析→汇总简报

6.2 最小可行架构(PER 三元组)

Planner (规划者) → Executor (执行者) → Reviewer (验收者)
角色职责OpenClaw 实现
Planner拆解目标,生成结构化 Spec一个 Agent,仅持有 sessions_sendfile_shareread_file 权限
Executor按 Spec 执行,产出结构化报告一个或多个 Agent,持有执行类工具,接收 Spec JSON
Reviewer对照 Spec 验收,决定放行/打回一个 Agent,仅持有只读权限,拥有驳回权

七、二维架构矩阵

横轴:隔离度(L1–L6) × 纵轴:组织方式(7 种框架 + PER)

任何交点都是一个可落地的方案,标注 ✓/△/✗ 表示适合程度。

L1 物理机L2 VML3 容器L4 多实例L5 同网关多 AgentL6 单 Agent 多角色
AutoGen 对话协作多机对话,最安全标准实践可行基本等同 L4降级为内部消息违背设计意图 ✗
CrewAI 角色团队重但可用各 VM 一角色轻量团队自然最舒服偷懒但危险
LangGraph 图状态分布状态管理复杂需网络状态同步K8s 级可本地 RPC最简单上下文已乱
MetaGPT SOP 流水线不适用可用可用适合顺畅容易自说自话
CAMEL 社会仿真真·社会实验限制多看不出效果
生产 SDK 型数据合规场景标准部署推荐推荐不够安全不安全 ✗
可视化平台型外部接入可部署常见可部署不可部署 ✗不可部署 ✗
PER 最小可用物理隔离 PER标准 PER轻量 PER快速 PER推荐起点最小但不推荐

各交点落地快照(OpenClaw 实现版):

组织方式 × 隔离级PlannerExecutorReviewer通信通道
PER × L2宿主机队长 Agent队员各占独立 VM 中的 Agent独立验收 VM网络 Redis/Kafka MQ
PER × L4独立实例,仅发 Spec独立实例,接收本地 HTTP/MQ独立验收实例本地 HTTP / Redis MQ
PER × L5同网关规划 Agent同网关子 Agent同网关验收 Agentsessions_send
CrewAI × L5Crew 内 SupervisorCrew 内角色 AgentCrew 内 Reviewer框架内部消息
LangGraph × L5图入口 Node各执行 Node条件边 + 校验 Node图状态流转
生产 SDK × L4独立规划实例隔离执行沙箱独立审计实例gRPC / MQ

设计方法:先用总表选定 (组织方式, 隔离级) 交点,再用快照表确定各角色的部署位置,最后填入对应的通信机制。


八、工程铁律

  1. 必须设验收 Agent:执行与验收必须分离,防止"自己出题自己判"。
  2. 任务交接深度限制:一项任务转手超过 3 次 即失控,超过 5 次必须重构流程。
  3. 权限与工具边界:与隔离级别强绑定。L2 队员 Agent 不应有访问宿主机数据库的权限。
  4. 全链路可观测:日志、链路追踪,所有 Agent 行动需可回溯。
  5. 拒绝聊天室产物:Agent 间传递必须是结构化数据(JSON Spec、报告 MD、状态码),严禁把聊天记录当 API。

九、部署环境全景

部署环境
  └─ 单机
       ├─ 方案 2 = L5:单实例多 Agent
       │     通信:sessions_send(内部消息通道)
       └─ 方案 3 = L4:多实例单 Agent
             通信:本地 HTTP API / 本地 Redis MQ
             打通:反向代理 / 通信中继
  └─ 多机集群
       └─ = L2/L4 场景 + 网络通信层
             通信:远程 HTTP API / 网络 Redis/Kafka MQ / 通信中继
  └─ 云环境 (IaaS/PaaS/SaaS)
       └─ = 上述方案 × 云原生基础设施

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JerryGW

赠人玫瑰,手留余香

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值