都说2025年是 agent 智能体爆发之年,如今 AI 行业发展的怎么样了?

Java代理agent技术解密:揭秘方法计时器的神奇实现

年前就听说 2025 年将是 agent 智能体爆发之年,还没进入下半年就已经开始体现出来了。

当时还不明白 agent 智能体到底是什么意思,直到Manus 出现、MCP 爆火,越来越多的智能体开始进入人们的视野,且能够免费的使用下,我终于明白了 agent 确实能代替一些知识密集的岗位了。

1、“你们说的 Agent 智能体到底是个啥?”

简单说,就是大模型除了能够对话、推理之外,还能够拆解任务,并调用各种工具来实现你的要求,比如调用浏览器、写脚本、执行某个程序、读写本地文件等等。

但这么简单的说,就失去了我写这公众号的意义😄。如果说大模型是一个 静态的大脑(因为它训练完成后就不再学习成长了),那 Agent 就是给这个大脑赋予感官、手脚和记忆,让它更像一个完整的人。

机器人聊天素材-机器人聊天图片-机器人聊天素材图片下载-觅知网

  • 感官包括实时摄像头与麦克风等信息输入设备,比如 Google 在 5.12 IO 大会上展示的 AR 眼镜。

  • 手脚就更多了,它可以控制浏览器、写文稿、画图、机械臂、人行机器人等。

  • 记忆除了能记住历史对话的上下文之外,它还应该能够自我微调,也就是能像现在各平台的“猜你喜欢”一样,记住你的习惯与秉性,来更好的服务于人。

最开始的智能体,就是OpenAI的DeepResearch,它比我们常使用的DeepSeek R1 的推理模式前进了一步。能够先分析我们的提问 Prompt,根据提问的类别进行规划和拆解,分成多个子任务,每个子任务会进行单独的推理、搜索、阅读、总结,最后综合分析多个子任务的结果,交叉验证并去掉矛盾项。你看,这多像一个知识工作者的工作流程啊。

Deep Research - OpenAI推出的新型AI深度研究工具 | AI工具集

然后就是 3 月份Manus面世,它除了上述的拆分、分段搜索、推理总结外,还能够自我编程、调用浏览器、读写文件等操作,用看起来更炫酷的操作实现我们的需求。

2、Manus 舆论风波恰恰说明了人们对智能体的怀疑与接受

Manus虽然掀起了一场不小的舆论风波,效果也不尽如人意,但AI 行业内还是普遍认可这是真正意义上的第一款通用Agent。

Manus 中文版

网络上除了嘲讽其过度营销(邀请码被炒到了 10W 以上)。更多的是对Manus 技术含量的怀疑, “这不就是大模型套壳吗”。

这里得引用一下乔布斯的故事了,乔布斯当初被踢出苹果,又被请回去之后,在内部一个公开会上,一位工程师站起来挑战他:你又不懂技术,凭什么指导我们,做这个公司的领导者?乔布斯的回答是:我知道如何满足用户需求、用户需要什么样的产品、并且我可以把它卖出去。

Manus 也是这个道理,随着 DeepSeek 的出现,中小企业基本上都放弃了自研训练大模型,而改为微调开源大模型或调用商用大模型来实现具体的商业应用。

Agent的技术实现路径早在 24 年就已经论证过了,而且在美国已经有一些 ToB 的 Agent 存在,只不过Manus 之前从没有一个ToC的成型产品,所以它只不过是第一个把上文的“感官、手脚、记忆”整合了起来,公开给用户使用,而不再只是给投资人画饼的 Demo。

如果说 DeepSeek 让行业不再模型参数上继续内卷,而Manus则让行业开始意识到让 AI 从对话到交付成果的范式转变,这个需求场景是巨大的。所以5 月 3 日红杉资本在AI Ascent大会上肯定了 Agent 的市场规模将远大于现在的软件与在线服务市场。因为Agent 将会催生出更多的潜在需求,就像移动互联网催生了短视频、外卖、打车一样。

图片

临近5月底的今天,除了类Manus的通用Agent外(包括OpenAI的 Operator、字节的 Coze 空间等),中小型 AI 公司已经在垂直领域杀出了几条血路,包括这几天大火的设计类 Agent “Lovart”、办公类 Agent “Skywork”,而医疗、法律、金融等ToB 方向上的 Agent 就更多了,这也正是现在AI创业的主要方向了。

在垂直领域的 Agent 效果越来越好时,一人公司(一个真人老板,一群 AI 员工)也就越来越多,这也是我现在的努力方向。

3、Agent 智能体的发展趋势

谷歌 4 月份发布了一个 A2A 协议,意思是让Agent不再只是一个个工具,我们想起来才去用,而作为一个服务能被其他 Agent 调用,并且彼此互联形成一个由 Agent 组成的网络。

微软在 5.19 号高调宣布的概念:开放代理式网络(open agentic web),是一个由 AI 代理驱动的互联网新愿景。这里最关键的是“服务发现”能力,也就是说 Agent 能发现网络中各种能力的其他 Agent ,并主动去调用。

图片

打个比方,我想让我的私人 Agent 小白点个外卖,它除了调用外卖平台外,还可能会发现市场上有大众点评、小红书类的点评 Agent 找到最近好评的店家、还可能在主打优惠券的 Agent 上拿到折扣。

除了在每个垂类领域中做好服务外,这个新的 Agent 入口将是一个更大市值的产品,将是各大厂的厮杀之地。所以微软先跳了出来,但苹果、谷歌这些拥有操作系统的厂商们一定不愿意掉队。而国内,360 的纳米 AI 已经有了不错的成绩,但我想,也许微信还是最终的赢家。

所以,互联网很多领域将会被重塑,互联网大厂们在我们的个人习惯上挣到的钱,会因为我们将任务委托给 Agent 的情况下彻底改写。所以,现在又是一个时代变革的前夕,互联网大厂的格局又将重新洗牌。


 

 大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。


2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书 

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。



4.LLM面试题和面经合集


这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。



👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值