都说2025年是 agent 智能体爆发之年，如今 AI 行业发展的怎么样了？

最新推荐文章于 2026-06-18 14:16:48 发布

原创最新推荐文章于 2026-06-18 14:16:48 发布 · 758 阅读

24 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#人工智能 #程序员 #大模型部署 #大模型 #学习

Java代理agent技术解密：揭秘方法计时器的神奇实现

年前就听说 2025 年将是 agent 智能体爆发之年，还没进入下半年就已经开始体现出来了。

当时还不明白 agent 智能体到底是什么意思，直到Manus 出现、MCP 爆火，越来越多的智能体开始进入人们的视野，且能够免费的使用下，我终于明白了 agent 确实能代替一些知识密集的岗位了。

1、“你们说的 Agent 智能体到底是个啥？”

简单说，就是大模型除了能够对话、推理之外，还能够拆解任务，并调用各种工具来实现你的要求，比如调用浏览器、写脚本、执行某个程序、读写本地文件等等。

但这么简单的说，就失去了我写这公众号的意义😄。如果说大模型是一个静态的大脑（因为它训练完成后就不再学习成长了），那 Agent 就是给这个大脑赋予感官、手脚和记忆，让它更像一个完整的人。

机器人聊天素材-机器人聊天图片-机器人聊天素材图片下载-觅知网

感官包括实时摄像头与麦克风等信息输入设备，比如 Google 在 5.12 IO 大会上展示的 AR 眼镜。
手脚就更多了，它可以控制浏览器、写文稿、画图、机械臂、人行机器人等。
记忆除了能记住历史对话的上下文之外，它还应该能够自我微调，也就是能像现在各平台的“猜你喜欢”一样，记住你的习惯与秉性，来更好的服务于人。

最开始的智能体，就是OpenAI的DeepResearch，它比我们常使用的DeepSeek R1 的推理模式前进了一步。能够先分析我们的提问 Prompt，根据提问的类别进行规划和拆解，分成多个子任务，每个子任务会进行单独的推理、搜索、阅读、总结，最后综合分析多个子任务的结果，交叉验证并去掉矛盾项。你看，这多像一个知识工作者的工作流程啊。

Deep Research - OpenAI推出的新型AI深度研究工具 | AI工具集

然后就是 3 月份Manus面世，它除了上述的拆分、分段搜索、推理总结外，还能够自我编程、调用浏览器、读写文件等操作，用看起来更炫酷的操作实现我们的需求。

2、Manus 舆论风波恰恰说明了人们对智能体的怀疑与接受

Manus虽然掀起了一场不小的舆论风波，效果也不尽如人意，但AI 行业内还是普遍认可这是真正意义上的第一款通用Agent。

Manus 中文版

网络上除了嘲讽其过度营销（邀请码被炒到了 10W 以上）。更多的是对Manus 技术含量的怀疑， “这不就是大模型套壳吗”。

这里得引用一下乔布斯的故事了，乔布斯当初被踢出苹果，又被请回去之后，在内部一个公开会上，一位工程师站起来挑战他：你又不懂技术，凭什么指导我们，做这个公司的领导者？乔布斯的回答是：我知道如何满足用户需求、用户需要什么样的产品、并且我可以把它卖出去。

Manus 也是这个道理，随着 DeepSeek 的出现，中小企业基本上都放弃了自研训练大模型，而改为微调开源大模型或调用商用大模型来实现具体的商业应用。

Agent的技术实现路径早在 24 年就已经论证过了，而且在美国已经有一些 ToB 的 Agent 存在，只不过Manus 之前从没有一个ToC的成型产品，所以它只不过是第一个把上文的“感官、手脚、记忆”整合了起来，公开给用户使用，而不再只是给投资人画饼的 Demo。

如果说 DeepSeek 让行业不再模型参数上继续内卷，而Manus则让行业开始意识到让 AI 从对话到交付成果的范式转变，这个需求场景是巨大的。所以5 月 3 日红杉资本在AI Ascent大会上肯定了 Agent 的市场规模将远大于现在的软件与在线服务市场。因为Agent 将会催生出更多的潜在需求，就像移动互联网催生了短视频、外卖、打车一样。

临近5月底的今天，除了类Manus的通用Agent外（包括OpenAI的 Operator、字节的 Coze 空间等），中小型 AI 公司已经在垂直领域杀出了几条血路，包括这几天大火的设计类 Agent “Lovart”、办公类 Agent “Skywork”，而医疗、法律、金融等ToB 方向上的 Agent 就更多了，这也正是现在AI创业的主要方向了。

在垂直领域的 Agent 效果越来越好时，一人公司（一个真人老板，一群 AI 员工）也就越来越多，这也是我现在的努力方向。

3、Agent 智能体的发展趋势

谷歌 4 月份发布了一个 A2A 协议，意思是让Agent不再只是一个个工具，我们想起来才去用，而作为一个服务能被其他 Agent 调用，并且彼此互联形成一个由 Agent 组成的网络。

微软在 5.19 号高调宣布的概念：开放代理式网络（open agentic web），是一个由 AI 代理驱动的互联网新愿景。这里最关键的是“服务发现”能力，也就是说 Agent 能发现网络中各种能力的其他 Agent ，并主动去调用。