本文介绍了AI领域的新概念“Loop Engineering”,作为继Prompt和Context工程之后的又一次技术飞跃。通过分析Loop Engineering如何帮助大模型更好地与外部世界交互,实现更复杂任务的管理与调度,阐述了其在提升AI应用效率与智能化水平方面的巨大潜力。同时,文章也指出了Loop Engineering在实际应用中可能面临的成本问题,并强调技能积累的重要性。对于希望在大模型领域深入学习的小白和程序员来说,本文提供了宝贵的入门知识和实用建议。

擅于创造新词的美国 AI 圈子,又双叒叕创建了一个新的词:Loop Engineering,

说实在的在看到 Harness Engineering 时,我就感觉其实没有什么太多新的东西,在模型智能已经发展到现在这种程度的情况下,除了模型本身,做好周边的工程化工作也能带来更大的提升。
那我们看看什么是 Loop Engineering 吧…
发展历程
在 AI 最近三年多的过程中,我们已经遇到过几个这样的 Engineering,从中可以看出 AI 的发展历程。
Prompt Engineering (提示工程)
在 ChatGPT 时刻以后,我们最先使用的场景是 chatbot,通过页面或一些客户端应用跟大模型直接聊天。
在这个过程中,需要一些技巧把我们想问的问题整理得有条理,这样能让大模型产生更好的回答。
它关心的是:指令怎么写、例子怎么放、格式怎么约束、角色/目标/边界怎么设定。它可以出现在多轮里,但它的主要单位仍然是一次模型调用。
实测17种提示词工程技术
Context Engineering (上下文工程)
大模型有几个先天的限制:
- 大模型是没有记忆的
- 模型的注意力是稀缺资源
- 模型的上下文窗口是稀缺资源
大模型的上下文大小从最初的几十K到上百K,再到现在的普遍支持的1M,虽然在不断加大,但是人类的任务也越来越复杂,上下文空间再大也可以被用完。
而且,当上下文太多时,有不同方向的信息放在一起,也会使大模型"猜测"不到我们的要点,从而产生回答偏差。
那么,在完成复杂任务时,我们就要将根据RAG检索到的资料、历史保留的信息、工具调用结果的摘要、哪些信息信息该压缩、哪些信息该隔离。
在 Context Engineering 中,重要的是调用醋前,在有限的上下文窗口中,构造最适合当前任务的上下文状态。
Context Engineering:长上下文是如何失效的?
Context Engineering: 如何修复上下文
一文读懂上下文工程(Context Engineering)
所有的一切都是上下文 - 深入研究Claude体系的感悟
Harness Engineering
这个词是随着Claude Code、Codex等 Coding Agent 快速发展而产生的。
说实在的,刚开始时,对 Harness 翻译成马具我非常不理解,感觉这个词又不好理解,也不好听。
后来,我是联想到古代马镫的进化,才慢慢理解了它的意思。而通过对 OpenClaw (龙虾) 开源代码的学习,才开始体会到这其中的意味。
下面这张图很形象,

在马镫发明之前,大家都是在光光的马背上驾驭战马,那么越好的马可能越难以驾驭,而且对骑手的要求也很高。但是马镫发明以后,一方面对骑手的要求降低了,一方面可以更好地发挥战马的能力。
现在模型的能力越来越强,但是它还是不能自己读取我们的代码库、不能自己操作我们的电脑、不能自己调用各种工具、不能时时更新的自己的知识库等等,这时就需要一个 Runtime(运行时) 的助手,帮它完成这些脏活、累活,还要帮助它形成记忆(文件、数据库等等),最后,还要将所有的这些信息组装成有效的 Context(上下文) 再提供给模型,只到模型完成预定的目标。
Harness 解决的是:agent 怎么行动,
它给 LLM 工具、权限、文件、浏览器、测试、数据结构、计划机制,让它能和外部世界发生接触。
什么是 Loop Engineering?
从 Prompt Engineering 到 Context Engineering,再到 Harness Engineering,都是以模型的能力为基础,通过工程化的方法,更好地与模型进行交互,从而完成越来越复杂的工作。
那么还缺少什么呢?
什么样的工作是可以接受的?
龙虾(OpenClaw) 爆火的主要原因是它能完成的任务已经与我们日常的工作很相近了,所以大家能理解它能做什么。我记得当时各种自媒体中讲的都是它能自己完整地完成这个、完成那个等等等等。
我自己在使用 Claude Code 或 Codex 或 AntiGravity 这样的 Coding Agent 的时候,已经完全不自己写代码,它写完之后,我的主要职责是评估和测试。
所以,经常的流程是:
人
-> 给目标
-> agent/harness 执行
-> 人检查
-> 人继续提示或结束
在 Claude Code 中我们可以利用 Hooks 增加一些检查点,在模型已经判断结束的基础上,增加一些检查点,但是总体上任务还是需要人来进行判断。
这,还不够智能。
Loop 是做什么的?
Agent 的核心是一个调用循环,它给模型提供了任务信息以及可能使用的工具,模型自己会判断该调用哪个工具,通过 Harness Runtime 去执行这些工具,然后将工具的结果返回给模型,再进行下一次判断,只要模型认为任务已经完成为止,为人类提供一个摘要,由人类判断任务结果是否满足要求。
那么,Loop 解决的是:agent 什么时候继续、什么时候修正、什么时候结束、什么时候升级给人。
它把原来人类在旁边做的判断工程化:
- “你还没做完,继续。”
- “测试失败了,回去修。”
- “issue 信息不够,先追问。”
- “这个任务风险太高,暂停等人确认。”
- “结果已经满足验收标准,可以结束。”
有 loop 时:
人
-> 给目标/规则/预算/验收标准
-> loop 控制器
-> agent/harness 执行
-> 收集结果
-> 判断是否完成
-> 不完成则继续、修正、重试、拆分或升级
-> 人看最终结果或关键异常
这相当于为原来的 Agent 又加了一层管理多个任务、多个 Agent Loop 的调度循环。
真正动手时,它是什么样子的?
Boris Cherny (Claude Code的创始人) 使用 Claude Code 中的 /loop 命令,利用一行 prompt 演示了最经典的入门实例。
把下面这行贴进去,改掉名词。
/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.
几天后,Boris 发了五条让 Opus 自主跑几小时甚至几天的建议。

- 权限用 auto 模式,这样 Claude 就不会来要批准;
- 用 dynamic workflows 让 Claude 编排成百上千个智能体去完成一个任务;
- 用 /goal 或 /loop 推 Claude 一直干到完;
- 在云端用 Claude Code,这样你就能合上笔记本;
- 以及,确保 Claude 有办法端到端地自我验证它的工作。
— 2026 年 6 月
在最近 X 上,很多人讨论 Long-Running,其实就是怎么通过不断的 Loop,让 Agent 能长时间地运行,不过我觉得这个已经太复杂了,太深入的地方等乃至再深入学习也不迟,说不定(概率很大)过两天又出现个新词替代掉 Loop Engineering 呢!
Loop 有什么样的代价呢?
通过Long-Running、可以完成完整的任务,在这些美好的愿景下是什么呢?
龙虾当时在中国的推进是由国内的模型厂商推动的,字节、阿里、Minimax、GLM都推出了云端的各种 Claw,腾讯还在演进推出免费为用户安装龙虾,小米虽然推出的较晚,但是现在也推出了自己的 Claw,而它们看到的都是以后 Agent 的烧 Token 的能力。
如果没有各种 Coding Plan,单单按 API 计费,可能没有多少人能真正用得起龙虾,当然也包括Claude Code、Codex等等。
那么,现在再这个内循环(inner loop)的基础上又增加了一层外循环(outer loop),可以想见对 Token 的需求量又会成倍的增加。
最近的新闻,Uber 在四个月里烧光了全年的 AI 预算后,把工程师的 Claude Code 和 Cursor 上限定在了每人每工具每月 1500 美元。一旦模型几乎免费地写好了代码,成本就转移到了跑它的循环上。
在 AI 时代,学习新的技术名词的同时,也要时不时掂量一下自己的钱袋子,因为每次调用都是真金白银地在花钱!
最后的一点补充
有另一个反复出现的观点与 loop 那条配成一对,而且是更耐久的那一半:
一件事如果你要做不止一次,就把它做成一个自动化 skill;
一件事如果你觉得难,做完之后也把它做成一个 skill,这样下次就是免费的。
一个里面没有任何可复用 skill 的循环,只是一个围着一个陌生人转的 while-true。
一个调用着一库锋利、经过测试、有名字的 skill 的循环,才是一个会复利增长的系统。
我觉得这也是给我们提了一个醒,不论关于 Agent 的工程结构如何变化,有一些最基本的能力却是越来越有用,Skills 可能是现在最重要的基础设施之一,而将自己的业务与场景结合起来 Skills 是人人都可以做到的事情。
真要学习的话,先把这些基础知识学好!
还有一点,我觉得国内大模型如果能把 Agentic 能力做得更好,通过 Harness 或 Loop 这些不管什么 Engineering 都好,就可能在更多的实用场景中发挥更大的作用,也真正能帮到希望真正使用 AI 的用户或企业,又好又便宜地改造自己的工作。
最后
如果说程序员已经是高薪职业,那么干AI的程序员,就是高薪中的高薪。

现在的市场,已经用数据给程序员指明了方向:学AI大模型,就是冲刺高薪的最优解!

看着身边越来越多的同行转型大模型、拿到高薪offer,很多人心里都动了心,但真正的难题来了:零基础小白不知道从哪入门?有基础的程序员找不到系统学习路径?实战项目练手无门?面试不知道考什么?
别慌!今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包,覆盖从入门到实战、从理论到面试、从基础到进阶的全流程,所有资料均已整理归档,无冗余、无套路,免费分享给每一位想抓住AI风口的程序员和小白!
👇👇扫码免费领取全部内容👇👇

1、大模型系统化学习路线

2、大模型学习书籍&文档

3、AI大模型最新行业报告

4、大模型项目实战&配套源码

5、大模型大厂面试真题

四阶段精细化学习规划(附时间节点,可直接照做)
结合上述资源,给大家整理了一份可直接落地的四阶段学习规划,总时长约2个月,小白可循序渐进,程序员可根据自身基础调整节奏,高效掌握大模型核心能力,快速实现从“入门”到“能落地、能面试”的跨越。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
👇👇扫码免费领取全部内容👇👇

6、这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】


170

被折叠的 条评论
为什么被折叠?



