收藏必备！小白程序员必学：大模型工程化新宠——Loop Engineering入门指南

原创于 2026-06-29 10:57:27 发布 · 130 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

本文介绍了AI领域的新概念“Loop Engineering”，作为继Prompt和Context工程之后的又一次技术飞跃。通过分析Loop Engineering如何帮助大模型更好地与外部世界交互，实现更复杂任务的管理与调度，阐述了其在提升AI应用效率与智能化水平方面的巨大潜力。同时，文章也指出了Loop Engineering在实际应用中可能面临的成本问题，并强调技能积累的重要性。对于希望在大模型领域深入学习的小白和程序员来说，本文提供了宝贵的入门知识和实用建议。

擅于创造新词的美国 AI 圈子，又双叒叕创建了一个新的词：Loop Engineering，

说实在的在看到 Harness Engineering 时，我就感觉其实没有什么太多新的东西，在模型智能已经发展到现在这种程度的情况下，除了模型本身，做好周边的工程化工作也能带来更大的提升。

那我们看看什么是 Loop Engineering 吧…

发展历程

在 AI 最近三年多的过程中，我们已经遇到过几个这样的 Engineering，从中可以看出 AI 的发展历程。

Prompt Engineering （提示工程）

在 ChatGPT 时刻以后，我们最先使用的场景是 chatbot，通过页面或一些客户端应用跟大模型直接聊天。

在这个过程中，需要一些技巧把我们想问的问题整理得有条理，这样能让大模型产生更好的回答。

它关心的是：指令怎么写、例子怎么放、格式怎么约束、角色/目标/边界怎么设定。它可以出现在多轮里，但它的主要单位仍然是一次模型调用。

实测17种提示词工程技术

Context Engineering （上下文工程）

大模型有几个先天的限制：

大模型是没有记忆的
模型的注意力是稀缺资源
模型的上下文窗口是稀缺资源

大模型的上下文大小从最初的几十K到上百K，再到现在的普遍支持的1M，虽然在不断加大，但是人类的任务也越来越复杂，上下文空间再大也可以被用完。

而且，当上下文太多时，有不同方向的信息放在一起，也会使大模型"猜测"不到我们的要点，从而产生回答偏差。

那么，在完成复杂任务时，我们就要将根据RAG检索到的资料、历史保留的信息、工具调用结果的摘要、哪些信息信息该压缩、哪些信息该隔离。

在 Context Engineering 中，重要的是调用醋前，在有限的上下文窗口中，构造最适合当前任务的上下文状态。

Context Engineering：长上下文是如何失效的？
Context Engineering: 如何修复上下文
一文读懂上下文工程(Context Engineering)
所有的一切都是上下文 - 深入研究Claude体系的感悟

Harness Engineering

这个词是随着Claude Code、Codex等 Coding Agent 快速发展而产生的。

说实在的，刚开始时，对 Harness 翻译成马具我非常不理解，感觉这个词又不好理解，也不好听。

后来，我是联想到古代马镫的进化，才慢慢理解了它的意思。而通过对 OpenClaw (龙虾) 开源代码的学习，才开始体会到这其中的意味。

下面这张图很形象，

在马镫发明之前，大家都是在光光的马背上驾驭战马，那么越好的马可能越难以驾驭，而且对骑手的要求也很高。但是马镫发明以后，一方面对骑手的要求降低了，一方面可以更好地发挥战马的能力。

现在模型的能力越来越强，但是它还是不能自己读取我们的代码库、不能自己操作我们的电脑、不能自己调用各种工具、不能时时更新的自己的知识库等等，这时就需要一个 Runtime（运行时) 的助手，帮它完成这些脏活、累活，还要帮助它形成记忆(文件、数据库等等)，最后，还要将所有的这些信息组装成有效的 Context(上下文) 再提供给模型，只到模型完成预定的目标。

Harness 解决的是：agent 怎么行动，
它给 LLM 工具、权限、文件、浏览器、测试、数据结构、计划机制，让它能和外部世界发生接触。

什么是 Loop Engineering?

从 Prompt Engineering 到 Context Engineering，再到 Harness Engineering，都是以模型的能力为基础，通过工程化的方法，更好地与模型进行交互，从而完成越来越复杂的工作。

那么还缺少什么呢？

什么样的工作是可以接受的？

龙虾(OpenClaw) 爆火的主要原因是它能完成的任务已经与我们日常的工作很相近了，所以大家能理解它能做什么。我记得当时各种自媒体中讲的都是它能自己完整地完成这个、完成那个等等等等。

我自己在使用 Claude Code 或 Codex 或 AntiGravity 这样的 Coding Agent 的时候，已经完全不自己写代码，它写完之后，我的主要职责是评估和测试。

所以，经常的流程是：

人
  -> 给目标
  -> agent/harness 执行
  -> 人检查
  -> 人继续提示或结束

在 Claude Code 中我们可以利用 Hooks 增加一些检查点，在模型已经判断结束的基础上，增加一些检查点，但是总体上任务还是需要人来进行判断。

这，还不够智能。

Loop 是做什么的？

Agent 的核心是一个调用循环，它给模型提供了任务信息以及可能使用的工具，模型自己会判断该调用哪个工具，通过 Harness Runtime 去执行这些工具，然后将工具的结果返回给模型，再进行下一次判断，只要模型认为任务已经完成为止，为人类提供一个摘要，由人类判断任务结果是否满足要求。

那么，Loop 解决的是：agent 什么时候继续、什么时候修正、什么时候结束、什么时候升级给人。

它把原来人类在旁边做的判断工程化：

“你还没做完，继续。”
“测试失败了，回去修。”
“issue 信息不够，先追问。”
“这个任务风险太高，暂停等人确认。”
“结果已经满足验收标准，可以结束。”

有 loop 时：

人
  -> 给目标/规则/预算/验收标准
  -> loop 控制器
      -> agent/harness 执行
      -> 收集结果
      -> 判断是否完成
      -> 不完成则继续、修正、重试、拆分或升级
  -> 人看最终结果或关键异常

这相当于为原来的 Agent 又加了一层管理多个任务、多个 Agent Loop 的调度循环。

真正动手时，它是什么样子的？

Boris Cherny (Claude Code的创始人) 使用 Claude Code 中的 /loop 命令，利用一行 prompt 演示了最经典的入门实例。

把下面这行贴进去，改掉名词。

/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.

几天后，Boris 发了五条让 Opus 自主跑几小时甚至几天的建议。

权限用 auto 模式，这样 Claude 就不会来要批准；
用 dynamic workflows 让 Claude 编排成百上千个智能体去完成一个任务；
用 /goal 或 /loop 推 Claude 一直干到完；
在云端用 Claude Code，这样你就能合上笔记本；
以及，确保 Claude 有办法端到端地自我验证它的工作。

— 2026 年 6 月

在最近 X 上，很多人讨论 Long-Running，其实就是怎么通过不断的 Loop，让 Agent 能长时间地运行，不过我觉得这个已经太复杂了，太深入的地方等乃至再深入学习也不迟，说不定(概率很大)过两天又出现个新词替代掉 Loop Engineering 呢！

Loop 有什么样的代价呢？

通过Long-Running、可以完成完整的任务，在这些美好的愿景下是什么呢？

龙虾当时在中国的推进是由国内的模型厂商推动的，字节、阿里、Minimax、GLM都推出了云端的各种 Claw，腾讯还在演进推出免费为用户安装龙虾，小米虽然推出的较晚，但是现在也推出了自己的 Claw，而它们看到的都是以后 Agent 的烧 Token 的能力。

如果没有各种 Coding Plan，单单按 API 计费，可能没有多少人能真正用得起龙虾，当然也包括Claude Code、Codex等等。

那么，现在再这个内循环(inner loop)的基础上又增加了一层外循环(outer loop)，可以想见对 Token 的需求量又会成倍的增加。

最近的新闻，Uber 在四个月里烧光了全年的 AI 预算后，把工程师的 Claude Code 和 Cursor 上限定在了每人每工具每月 1500 美元。一旦模型几乎免费地写好了代码，成本就转移到了跑它的循环上。

在 AI 时代，学习新的技术名词的同时，也要时不时掂量一下自己的钱袋子，因为每次调用都是真金白银地在花钱！

最后的一点补充

有另一个反复出现的观点与 loop 那条配成一对，而且是更耐久的那一半：
一件事如果你要做不止一次，就把它做成一个自动化 skill；
一件事如果你觉得难，做完之后也把它做成一个 skill，这样下次就是免费的。
一个里面没有任何可复用 skill 的循环，只是一个围着一个陌生人转的 while-true。
一个调用着一库锋利、经过测试、有名字的 skill 的循环，才是一个会复利增长的系统。

我觉得这也是给我们提了一个醒，不论关于 Agent 的工程结构如何变化，有一些最基本的能力却是越来越有用，Skills 可能是现在最重要的基础设施之一，而将自己的业务与场景结合起来 Skills 是人人都可以做到的事情。

真要学习的话，先把这些基础知识学好！

还有一点，我觉得国内大模型如果能把 Agentic 能力做得更好，通过 Harness 或 Loop 这些不管什么 Engineering 都好，就可能在更多的实用场景中发挥更大的作用，也真正能帮到希望真正使用 AI 的用户或企业，又好又便宜地改造自己的工作。

最后

如果说程序员已经是高薪职业，那么干AI的程序员，就是高薪中的高薪。

现在的市场，已经用数据给程序员指明了方向：学AI大模型，就是冲刺高薪的最优解！

看着身边越来越多的同行转型大模型、拿到高薪offer，很多人心里都动了心，但真正的难题来了：零基础小白不知道从哪入门？有基础的程序员找不到系统学习路径？实战项目练手无门？面试不知道考什么？

别慌！今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包，覆盖从入门到实战、从理论到面试、从基础到进阶的全流程，所有资料均已整理归档，无冗余、无套路，免费分享给每一位想抓住AI风口的程序员和小白！

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

1、大模型系统化学习路线

在这里插入图片描述

2、大模型学习书籍&文档

在这里插入图片描述

3、AI大模型最新行业报告

在这里插入图片描述

4、大模型项目实战&配套源码

5、大模型大厂面试真题

四阶段精细化学习规划（附时间节点，可直接照做）

结合上述资源，给大家整理了一份可直接落地的四阶段学习规划，总时长约2个月，小白可循序渐进，程序员可根据自身基础调整节奏，高效掌握大模型核心能力，快速实现从“入门”到“能落地、能面试”的跨越。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

6、这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。
在这里插入图片描述