收藏必备!小白程序员必学:大模型工程化新宠——Loop Engineering入门指南

本文介绍了AI领域的新概念“Loop Engineering”,作为继Prompt和Context工程之后的又一次技术飞跃。通过分析Loop Engineering如何帮助大模型更好地与外部世界交互,实现更复杂任务的管理与调度,阐述了其在提升AI应用效率与智能化水平方面的巨大潜力。同时,文章也指出了Loop Engineering在实际应用中可能面临的成本问题,并强调技能积累的重要性。对于希望在大模型领域深入学习的小白和程序员来说,本文提供了宝贵的入门知识和实用建议。

图片

擅于创造新词的美国 AI 圈子,又双叒叕创建了一个新的词:Loop Engineering,

图片

说实在的在看到 Harness Engineering 时,我就感觉其实没有什么太多新的东西,在模型智能已经发展到现在这种程度的情况下,除了模型本身,做好周边的工程化工作也能带来更大的提升。

那我们看看什么是 Loop Engineering 吧…


发展历程

在 AI 最近三年多的过程中,我们已经遇到过几个这样的 Engineering,从中可以看出 AI 的发展历程。

Prompt Engineering (提示工程)

在 ChatGPT 时刻以后,我们最先使用的场景是 chatbot,通过页面或一些客户端应用跟大模型直接聊天。

在这个过程中,需要一些技巧把我们想问的问题整理得有条理,这样能让大模型产生更好的回答。

它关心的是:指令怎么写、例子怎么放、格式怎么约束、角色/目标/边界怎么设定。它可以出现在多轮里,但它的主要单位仍然是一次模型调用。

实测17种提示词工程技术

Context Engineering (上下文工程)

大模型有几个先天的限制:

  • 大模型是没有记忆的
  • 模型的注意力是稀缺资源
  • 模型的上下文窗口是稀缺资源

大模型的上下文大小从最初的几十K到上百K,再到现在的普遍支持的1M,虽然在不断加大,但是人类的任务也越来越复杂,上下文空间再大也可以被用完。

而且,当上下文太多时,有不同方向的信息放在一起,也会使大模型"猜测"不到我们的要点,从而产生回答偏差。

那么,在完成复杂任务时,我们就要将根据RAG检索到的资料、历史保留的信息、工具调用结果的摘要、哪些信息信息该压缩、哪些信息该隔离。

在 Context Engineering 中,重要的是调用醋前,在有限的上下文窗口中,构造最适合当前任务的上下文状态。

Context Engineering:长上下文是如何失效的?
Context Engineering: 如何修复上下文
一文读懂上下文工程(Context Engineering)
所有的一切都是上下文 - 深入研究Claude体系的感悟

Harness Engineering

这个词是随着Claude Code、Codex等 Coding Agent 快速发展而产生的。

说实在的,刚开始时,对 Harness 翻译成马具我非常不理解,感觉这个词又不好理解,也不好听。

后来,我是联想到古代马镫的进化,才慢慢理解了它的意思。而通过对 OpenClaw (龙虾) 开源代码的学习,才开始体会到这其中的意味。

下面这张图很形象,

图片

在马镫发明之前,大家都是在光光的马背上驾驭战马,那么越好的马可能越难以驾驭,而且对骑手的要求也很高。但是马镫发明以后,一方面对骑手的要求降低了,一方面可以更好地发挥战马的能力。

现在模型的能力越来越强,但是它还是不能自己读取我们的代码库、不能自己操作我们的电脑、不能自己调用各种工具、不能时时更新的自己的知识库等等,这时就需要一个 Runtime(运行时) 的助手,帮它完成这些脏活、累活,还要帮助它形成记忆(文件、数据库等等),最后,还要将所有的这些信息组装成有效的 Context(上下文) 再提供给模型,只到模型完成预定的目标。

Harness 解决的是:agent 怎么行动,
它给 LLM 工具、权限、文件、浏览器、测试、数据结构、计划机制,让它能和外部世界发生接触。

什么是 Loop Engineering?

从 Prompt Engineering 到 Context Engineering,再到 Harness Engineering,都是以模型的能力为基础,通过工程化的方法,更好地与模型进行交互,从而完成越来越复杂的工作。

那么还缺少什么呢?

什么样的工作是可以接受的?

龙虾(OpenClaw) 爆火的主要原因是它能完成的任务已经与我们日常的工作很相近了,所以大家能理解它能做什么。我记得当时各种自媒体中讲的都是它能自己完整地完成这个、完成那个等等等等。

我自己在使用 Claude Code 或 Codex 或 AntiGravity 这样的 Coding Agent 的时候,已经完全不自己写代码,它写完之后,我的主要职责是评估和测试。

所以,经常的流程是:

人
  -> 给目标
  -> agent/harness 执行
  -> 人检查
  -> 人继续提示或结束

在 Claude Code 中我们可以利用 Hooks 增加一些检查点,在模型已经判断结束的基础上,增加一些检查点,但是总体上任务还是需要人来进行判断。

这,还不够智能。

Loop 是做什么的?

Agent 的核心是一个调用循环,它给模型提供了任务信息以及可能使用的工具,模型自己会判断该调用哪个工具,通过 Harness Runtime 去执行这些工具,然后将工具的结果返回给模型,再进行下一次判断,只要模型认为任务已经完成为止,为人类提供一个摘要,由人类判断任务结果是否满足要求。

那么,Loop 解决的是:agent 什么时候继续、什么时候修正、什么时候结束、什么时候升级给人。

它把原来人类在旁边做的判断工程化:

  • “你还没做完,继续。”
  • “测试失败了,回去修。”
  • “issue 信息不够,先追问。”
  • “这个任务风险太高,暂停等人确认。”
  • “结果已经满足验收标准,可以结束。”

有 loop 时:

人
  -> 给目标/规则/预算/验收标准
  -> loop 控制器
      -> agent/harness 执行
      -> 收集结果
      -> 判断是否完成
      -> 不完成则继续、修正、重试、拆分或升级
  -> 人看最终结果或关键异常

这相当于为原来的 Agent 又加了一层管理多个任务、多个 Agent Loop 的调度循环。

真正动手时,它是什么样子的?

Boris Cherny (Claude Code的创始人) 使用 Claude Code 中的 /loop 命令,利用一行 prompt 演示了最经典的入门实例。

把下面这行贴进去,改掉名词。

/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.

几天后,Boris 发了五条让 Opus 自主跑几小时甚至几天的建议。

图片

  • 权限用 auto 模式,这样 Claude 就不会来要批准;
  • 用 dynamic workflows 让 Claude 编排成百上千个智能体去完成一个任务;
  • 用 /goal 或 /loop 推 Claude 一直干到完;
  • 在云端用 Claude Code,这样你就能合上笔记本;
  • 以及,确保 Claude 有办法端到端地自我验证它的工作。

— 2026 年 6 月

在最近 X 上,很多人讨论 Long-Running,其实就是怎么通过不断的 Loop,让 Agent 能长时间地运行,不过我觉得这个已经太复杂了,太深入的地方等乃至再深入学习也不迟,说不定(概率很大)过两天又出现个新词替代掉 Loop Engineering 呢!

Loop 有什么样的代价呢?

通过Long-Running、可以完成完整的任务,在这些美好的愿景下是什么呢?

龙虾当时在中国的推进是由国内的模型厂商推动的,字节、阿里、Minimax、GLM都推出了云端的各种 Claw,腾讯还在演进推出免费为用户安装龙虾,小米虽然推出的较晚,但是现在也推出了自己的 Claw,而它们看到的都是以后 Agent 的烧 Token 的能力。

如果没有各种 Coding Plan,单单按 API 计费,可能没有多少人能真正用得起龙虾,当然也包括Claude Code、Codex等等。

那么,现在再这个内循环(inner loop)的基础上又增加了一层外循环(outer loop),可以想见对 Token 的需求量又会成倍的增加。

最近的新闻,Uber 在四个月里烧光了全年的 AI 预算后,把工程师的 Claude Code 和 Cursor 上限定在了每人每工具每月 1500 美元。一旦模型几乎免费地写好了代码,成本就转移到了跑它的循环上。

在 AI 时代,学习新的技术名词的同时,也要时不时掂量一下自己的钱袋子,因为每次调用都是真金白银地在花钱!

最后的一点补充

有另一个反复出现的观点与 loop 那条配成一对,而且是更耐久的那一半:
一件事如果你要做不止一次,就把它做成一个自动化 skill;
一件事如果你觉得难,做完之后也把它做成一个 skill,这样下次就是免费的。
一个里面没有任何可复用 skill 的循环,只是一个围着一个陌生人转的 while-true。
一个调用着一库锋利、经过测试、有名字的 skill 的循环,才是一个会复利增长的系统。

我觉得这也是给我们提了一个醒,不论关于 Agent 的工程结构如何变化,有一些最基本的能力却是越来越有用,Skills 可能是现在最重要的基础设施之一,而将自己的业务与场景结合起来 Skills 是人人都可以做到的事情。

真要学习的话,先把这些基础知识学好!

还有一点,我觉得国内大模型如果能把 Agentic 能力做得更好,通过 Harness 或 Loop 这些不管什么 Engineering 都好,就可能在更多的实用场景中发挥更大的作用,也真正能帮到希望真正使用 AI 的用户或企业,又好又便宜地改造自己的工作。

最后

如果说程序员已经是高薪职业,那么干AI的程序员,就是高薪中的高薪。

图片

现在的市场,已经用数据给程序员指明了方向:学AI大模型,就是冲刺高薪的最优解!

图片

看着身边越来越多的同行转型大模型、拿到高薪offer,很多人心里都动了心,但真正的难题来了:零基础小白不知道从哪入门?有基础的程序员找不到系统学习路径?实战项目练手无门?面试不知道考什么?

别慌!今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包,覆盖从入门到实战、从理论到面试、从基础到进阶的全流程,所有资料均已整理归档,无冗余、无套路,免费分享给每一位想抓住AI风口的程序员和小白!

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

1、大模型系统化学习路线

在这里插入图片描述

2、大模型学习书籍&文档

在这里插入图片描述

3、AI大模型最新行业报告

在这里插入图片描述

4、大模型项目实战&配套源码

img

5、大模型大厂面试真题

img

四阶段精细化学习规划(附时间节点,可直接照做)

结合上述资源,给大家整理了一份可直接落地的四阶段学习规划,总时长约2个月,小白可循序渐进,程序员可根据自身基础调整节奏,高效掌握大模型核心能力,快速实现从“入门”到“能落地、能面试”的跨越。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

6、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值