【图书预告】《AI智能体应用开发》

原创已于 2026-06-03 14:38:46 修改 · 536 阅读

7 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #智能体 #AI Agent #agent

于 2026-06-03 12:02:06 首次发布

AI智能体应用开发专栏收录该内容

1 篇文章

订阅专栏

本书看点

（1）西电博导鲍亮、西邮博导崔江涛、西交博导李倩、中国煤科博导范涛诚意之作。

（2）研发垂直场景智能体论文没有理论？没有实战案例？看这本书就可以！

（3）理清智能体基础概念，以及智能体感知、记忆、知识、情感、推理、工具、协同等关键能力。

（4）详解智能体开发流程、应用参考架构、应用设计模式等工程实现技术。

（5）实战深度研究、数据分析、数据科学、决策优化、机器视觉等5类垂直场景智能体的完整开发过程。

（6）本书配套示例代码、PPT课件、读者交流微信群。

本书目的

本书系统梳理AI智能体应用开发的全链条知识体系，详解智能体开发全流程涉及的核心理论、关键技术、工程方法、落地流程、实用工具与行业实战案例，为开发者搭建从基础理论到产业实践的完整桥梁，助力解决技术落地中的架构设计、能力构建、场景适配等核心难题，推动AI智能体在工业、科研、政务、金融、服务等领域的规模化落地应用。

内容简介

本书共分16章，内容包括四大板块：介绍智能体基础概念（第1章）；详解智能体感知、记忆、知识、情感、推理、工具、协同等关键能力（第2~8章）；揭示智能体开发流程、应用参考架构、应用设计模式等工程技术（第9~11章）；剖析深度研究、数据分析、数据科学、决策优化、机器视觉等5类垂直场景智能体的完整开发过程（第12~16章）。

本书读者

本书既适合智能体初学者、智能体开发工程师、AI应用研发人员、行业智能化解决方案提供商，也适合高等院校或高职高专院校人工智能、软件工程、计算机相关专业的师生，以及关注智能体技术发展与产业应用的行业从业者。

前言

本书背景
随着大语言模型技术从基础突破迈向产业融合，AI智能体已实现从感知认知到自主决策的本质跃迁，成为通用人工智能落地与各行业智能化转型的核心引擎，深刻重塑人机交互逻辑与产业运行范式。AI智能体应用开发作为连接技术创新与产业价值的核心纽带，其覆盖的核心能力构建、架构设计、工程化落地等技术体系，直接决定了智能体技术在真实场景中的价值释放。
当前AI智能体应用开发仍面临显著壁垒：一方面，技术迭代迅猛，从单智能体核心能力到多智能体协同的知识体系持续拓展，开发者难以形成系统化认知；另一方面，工程实践碎片化，大量开发者陷入架构选型、场景适配等落地困境，难以将技术转化为业务价值，而系统掌握全链路开发方法成为破局关键。
经调研，当前行业内缺乏一本系统覆盖智能体从基础理论、开发方法到垂直场景落地的专业书籍。为此，作者结合多年学术研究与产业实践经验撰写本书，系统梳理智能体理论体系、核心能力、开发流程与设计模式，结合深度研究、数据分析、数据科学、决策优化、机器视觉等多类典型垂直场景提供完整落地方案，旨在为读者构建全维度的智能体开发知识体系，提供专业、可落地的实践指引。

本书内容
本书将分成4个部分对AI智能体应用开发的方法与技术进行讲解。
第一部分是AI智能体基础（第1章），对智能体的核心定义、发展历程、核心特性、与传统程序的本质区别及行业挑战等进行介绍。
第二部分是AI智能体核心能力技术（第2~8章），主要讲解智能体应用开发的核心底层技术体系，包括感知、记忆、知识、情感、推理、工具与多智能体协同等。
第三部分是AI智能体应用开发方法（第9~11章），主要介绍智能体应用开发全生命周期涉及的工程化方法与设计范式，包括智能体开发流程、应用参考架构与应用设计模式等。
第四部分是AI智能体应用开发案例（第12~16章），主要介绍垂直场景智能体项目的需求分析、系统架构、关键技术与工程落地方法，包括深度研究智能体、数据分析智能体、数据科学智能体、决策优化智能体、机器视觉智能体等5个实际案例。
配套资料下载
本书配套示例源码、PPT课件、配图PDF文件、读者技术交流微信群服务，读者需要使用自己的微信扫描下面的二维码获取。

本书适合的读者
   智能体开发初学者。
   智能体开发工程师。
   AI应用研究人员。
   行业智能化解决方案提供商。
   关注智能体技术发展与产业应用的行业从业者
   高等院校及高职高专院校学习AI智能体应用开发的学生。

作者与鸣谢
本书作者为鲍亮、崔江涛、李倩和范涛。本书在撰写过程中还得到了西安电子科技大学数据智能实验室的博士生和硕士生们的大力支持，他们是李宇飞（小飞）、赵凯博、李宇飞（大飞）、苏旭、张珂、张礼锁、韦卓纯、何伟、金科元、王楠、赵一全、张文颢、沈维枫、张文博、凌晨，在此一并表示感谢。
本书的顺利出版离不开清华大学出版社老师们的帮助，在此表示衷心的感谢。

著者
2026年5月

目    录	
	
第1章  智能体基础	1
1.1  智能体基础	1
1.1.1  智能体的核心定义与本质	1
1.1.2  智能体与传统程序的核心差异	2
1.1.3  智能体的核心构成要素	3
1.2  智能体发展历史	4
1.2.1  奠基期：符号主义主导的理论萌芽	4
1.2.2  黄金期：连接主义推动的学习革命	5
1.2.3  复兴期：深度学习加持的能力跃升	6
1.2.4  爆发期：大模型驱动的实用化浪潮	7
1.3  智能体的特点	7
1.3.1  自主性	7
1.3.2  适应性	9
1.3.3  学习能力	9
1.3.4  交互性	10
1.4  智能体应用的挑战	11
1.4.1  技术瓶颈	11
1.4.2  伦理与安全困境	11
1.4.3  开发生态与经济难题	12
1.5  本章小结	13
1.6  参考文献	13
第2章  智能体感知能力	16
2.1  智能体感知能力概述	16
2.2  文档感知任务定义与分类	17
2.2.1  文档输入类型	17
2.2.2  文档预处理的核心任务	17
2.2.3  文档预处理的输出类型	22
2.3  主流文档预处理工具	22
2.3.1  MinerU	22
2.3.2  PaddleOCR	24
2.3.3  PP-StructureV3	24
2.3.4  MonkeyOCR-1.5	26
2.3.5  DeepSeek-OCR	26
2.3.6  主流框架对比	27
2.4  智能体的其他模态感知能力	28
2.4.1  音频感知	29
2.4.2  图片感知	30
2.4.3  视频感知	31
2.5  本章小结	34
2.6  参考文献	34
第3章  智能体记忆能力	36
3.1  记忆能力的定义与内涵	36
3.1.1  记忆的形式化定义	37
3.1.2  记忆与上下文窗口的关系	38
3.1.3  多模态记忆：表征与对齐	39
3.2  记忆支撑与技术演进	40
3.2.1  记忆对智能体能力的系统性支撑	40
3.2.2  主流技术范式	41
3.2.3  研究挑战：从“有记忆”到“好记忆”	43
3.3  智能体三层记忆参考框架	43
3.3.1  第一层：感知记忆	43
3.3.2  第二层：工作记忆	45
3.3.3  第三层：长期记忆	46
3.3.4  动态调度机制	48
3.3.5  工程化示例：从Hello World到生产级	48
3.4  开源框架、工具与评估指标	51
3.4.1  记忆编排与管理框架	51
3.4.2  混合存储基础设施	51
3.4.3  记忆能力的评估指标	52
3.5  本章小结	52
3.6  参考文献	53
第4章  智能体知识能力	55
4.1  知识的定义与内涵	55
4.1.1  知识分层	56
4.1.2  知识类型	57
4.1.3  知识表示	58
4.2  知识管理	60
4.2.1  知识注入与检索	61
4.2.2  非结构化数据的知识工程	62
4.2.3  结构化数据的知识工程	63
4.2.4  知识治理与质量评估	64
4.3  知识赋能	66
4.3.1  知识即感知	66
4.3.2  知识即思考	67
4.3.3  知识即能力	68
4.4  开源技术栈选型	69
4.4.1  知识存储与检索引擎	69
4.4.2  知识编排与RAG框架	70
4.5  参考文献	72
第5章  智能体情感能力	74
5.1  能力定义	74
5.1.1  情感理解与共情（Affective Understanding，AU）	75
5.1.2  意图推断与心理理论（Theory of Mind，ToM）	76
5.1.3  社会适应与分寸（Social Adaptation，SA）	77
5.1.4  心智加持下的用户体验变化	77
5.2  如何为智能体提供支撑	78
5.2.1  心智情绪计算闭环：从输入到行动	78
5.2.2  表示与公式：让情绪成为可计算信号	79
5.2.3  推理与决策：快思考与慢思考	81
5.2.4  用户模型与ToM：让系统读懂“言外之意”	81
5.2.5  记忆系统：让相处跨越时间	82
5.2.6  反思机制：把事故变成经验	82
5.2.7  表达控制：让策略被听见	83
5.3  研究现状与趋势	84
5.3.1  斯坦福虚拟小镇（Generative Agents）	84
5.3.2  价值对齐与“宪法AI”	85
5.3.3  多模态共情的挑战	86
5.3.4  从“会聊天”到“会相处”：长期一致性成为核心指标	86
5.3.5  评价体系缺位：我们如何知道“情感能力变强了”？	87
5.3.6  现实落地的风险：心智越强，越要克制	87
5.4  开源软件与工具：实践形态与代表项目	87
5.5  本章小结	89
5.6  参考文献	90
第6章  智能体推理能力	92
6.1  推理的计算本质	92
6.1.1  概率拟合与逻辑涌现	93
6.1.2  快慢思考与双重架构	94
6.1.3  物理约束与信息边界	97
6.2  推理范式的演进	98
6.2.1  符号主义与规则推理	99
6.2.2  联结主义与概率预测	99
6.2.3  提示工程与逻辑涌现	99
6.2.4  自主智能与动态决策	100
6.3  推理增强的核心路径	100
6.3.1  推理时计算扩展	100
6.3.2  训练时能力内化	104
6.4  开发框架与工具链	105
6.4.1  推理编排与图架构	105
6.4.2  群体智能与协作	106
6.4.3  声明式提示编程	107
6.4.4  评估体系与可观测性	107
6.5  本章小结	108
6.6  参考文献	109
第7章  智能体工具能力	112
7.1  工具能力的定义与作用	112
7.1.1  工具能力的概念	112
7.1.2  工具能力在智能体中的地位	113
7.1.3  工具能力与智能体智能水平的关系	114
7.2  工具调用的核心机制	114
7.2.1  可调度能力	115
7.2.2  决策与选择机制	115
7.2.3  风险控制	116
7.3  工具类型与能力框架	116
7.3.1  数据库	116
7.3.2  数值计算	119
7.3.3  代码执行	120
7.4  工具能力实现体系	120
7.4.1  工具描述协议	121
7.4.2  IO格式设计与工具调用流程	123
7.4.3  异常处理	126
7.4.4  实现一个LangChain-Like Agent的最小原型	126
7.4.5  揭秘服务器端	132
7.5  其他工具生态	134
7.5.1  MCP	135
7.5.2  Claude Skills	136
7.6  参考文献	136
第8章  多智能体协同	139
8.1  多智能体协同的内涵与价值	139
8.1.1  核心概念	139
8.1.2  协同的核心价值与驱动力	142
8.1.3  核心协同场景	145
8.2  多智能体协同的能力支撑体系	148
8.2.1  协同架构模式设计	148
8.2.2  关键支撑技术	150
8.2.3  主流协同策略与实现路径	153
8.3  多智能体协同的研究现状与前沿	156
8.3.1  学术研究前沿方向	156
8.3.2  业界应用探索	159
8.4  开源软件与工具	161
8.5  本章小结	164
8.6  参考文献	164
第9章  智能体应用开发流程	167
9.1  从面向对象到面向智能体	167
9.1.1  复杂度的挑战与抽象的跃迁	168
9.1.2  面向智能体设计的兴起	170
9.2  问题定义与范围划定	172
9.2.1  痛点识别与价值主张	173
9.2.2  用户画像与核心场景识别	173
9.2.3  MVP边界与可行性定义	174
9.3  调研与探索	174
9.3.1  前沿技术综述与选型	174
9.3.2  关键技术原型验证	175
9.3.3  领域知识工程	176
9.4  系统设计与架构规划	177
9.4.1  智能体角色定义	177
9.4.2  协同机制与状态流转设计	178
9.4.3  记忆与知识体系设计	179
9.5  开发与实现	179
9.5.1  提示词工程	179
9.5.2  工具封装与调用	180
9.5.3  知识库	182
9.6  测试、评估与迭代优化	182
9.6.1  建立行为评估体系	182
9.6.2  系统化行为测试方法	183
9.6.3  数据驱动的迭代闭环	183
9.7  部署与持续运营	184
9.7.1  部署策略	184
9.7.2  持续运营	184
9.8  本章小结	185
9.9  参考文献	185
第10章  智能体应用参考架构	188
10.1  整体架构介绍	188
10.2  用户交互层	189
10.2.1  插件集成	189
10.2.2  命令行接口	190
10.2.3  Web界面	191
10.3  Agent调度层	191
10.3.1  主循环引擎	192
10.3.2  异步消息队列	192
10.3.3  会话流生成器	194
10.3.4  消息压缩器	194
10.4  工具执行与管理层介绍	195
10.4.1  工具引擎	195
10.4.2  并发控制	196
10.4.3  权限验证	197
10.4.4  可拓展工具生态系统	198
10.5  存储与持久化层	199
10.5.1  短期记忆	199
10.5.2  中期记忆	200
10.5.3  长期记忆	200
10.6  本章小结	201
10.6  参考文献	201
第11章  智能体应用设计模式	202
11.1  概述	202
11.2  流程与控制	203
11.2.1  提示链	203
11.2.2  路由	205
11.2.3  并行化	206
11.3  增强与优化	207
11.3.1  反思	207
11.3.2  规划	209
11.3.3  学习与适应	210
11.3.4  目标设定与监控	211
11.3.5  探索与发现	213
11.4  交互与协作	213
11.4.1  人机协作	213
11.4.2  多智能体协作	214
11.5  稳健性与安全	217
11.5.1  异常处理与恢复	217
11.5.2  优先级调度	218
11.5.3  安全护栏	218
11.5.4  评估与监控	219
11.6  本章小结	220
11.7  参考文献	221
第12章  深度研究智能体	223
12.1  需求分析	223
12.2  系统架构	224
12.2.1  系统功能模块	224
12.2.2  系统架构设计	225
12.3  关键技术	227
12.3.1  用户意图澄清	227
12.3.2  研究状态建模	227
12.3.3  研究子任务派遣	228
12.4  系统实现	229
12.4.1  主智能体	229
12.4.2  研究子智能体	241
12.5  本章小结	247
12.6  参考文献	247
第13章  数据分析智能体	248
13.1  需求分析	248
13.2  系统架构	249
13.2.1  业务架构	249
13.2.2  技术架构	253
13.3  关键技术	255
13.3.1  提示词工程	256
13.3.2  模式连接	258
13.3.3  代码生成与优化	259
13.3.4  高级数据分析能力	261
13.3.5  安全性和可扩展性	262
13.4  系统实现	264
13.4.1  NL2SQL系统实现案例	264
13.4.2  电子表格问答系统实现案例	271
13.5  本章小节	278
13.6  参考文献	279
第14章  数据科学智能体	282
14.1  需求分析	282
14.2  多智能体协同的能力支撑体系	283
14.2  系统架构	284
14.2.1  技术架构	284
14.2.2  业务架构	287
14.3  关键技术	289
14.3.1  大模型智能体协同框架	289
14.3.2  大模型利用数据科学工具	289
14.3.3  开放场景下的评估与基准体系	290
14.4  系统实现	291
14.4.1  理论阐述	291
14.4.2  案例分析	300
14.5  本章小结	319
14.6  参考文献	319
第15章  决策优化智能体	323
15.1  需求分析	323
11.2  系统架构	324
15.2.1  系统功能模块	324
15.2.2  系统架构设计	326
15.3  关键技术	327
15.3.1  决策优化领域知识图谱构建技术	328
15.3.2  基于有向无环图（DAG）的异构智能体编排技术	328
15.3.3  基于抽象语法树（AST）的约束代码生成技术	329
15.3.4  约束流（Constraint Streams）模板化映射技术	330
15.3.5  基于沙箱（Sandbox）的代码自修复与验证技术	331
15.3.6  基于问题特征学习的自适应算法选择技术	332
15.3.7  求解结果的可解释性分析与归因技术	332
15.4  系统实现	333
15.4.1  领域知识图谱的存储与检索实现	333
15.4.2  异构智能体工作流（LangGraph）的实现	335
15.4.3  抽象语法树（AST）构建器的实现	337
15.4.4  约束模板库与RAG检索的实现	341
15.4.5  基于沙箱的代码自修复与验证实现	343
15.4.6  自适应算法选择实现	347
15.4.7  求解结果可解释性实现	350
15.5  本章小结	353
15.6  参考文献	353
第16章  机器视觉智能体	354
16.1  需求分析	355
16.1.1  用户需求与使用场景	355
16.1.2  系统功能需求	356
16.2  系统架构	357
16.2.1  系统模块组成	357
16.2.2  模块间的信息流与交互方式	359
16.2.3  系统运行流程	360
16.3  关键技术	360
16.3.1  任务理解与系统规划关键技术	360
16.3.2  数据与标注关键技术	365
16.3.3  模型选择与训练流水线关键技术	371
16.3.4  评估分析与闭环优化关键技术	375
16.3.5  部署交付与系统工程关键技术	378
16.4  本章小结	380
16.5  参考文献	380