Qoder Browser Use实测:AI终于能像真人一样操控浏览器

P.S. 目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步,增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。注意,教程仅限真正想入门AI的朋友,否则看看零散的博文就够了。

前言

AI已经开始抢浏览器操作工的饭碗了。

没错,我说的就是Qoder这货。它最近搞了个Browser Use功能,直接把Agent的联网能力拉到了满中满,满到溢出来。

作为一个在AI领域摸爬滚打了22年的老炮,我见过太多"号称能上网"的AI工具。结果呢?要么卡在登录页面像只无头苍蝇,要么把网页元素当成抽象画来欣赏。

Qoder这次不一样,它玩真的。

内置浏览器:Agent的"眼睛"终于不近视了

首先,Qoder很早的版本就内置了一个浏览器。

注意,不是那种"假装有浏览器"的玩具,而是真·浏览器,支持开发者模式、元素选择的那种。

这就好比什么呢?以前你的AI是个高度近视的程序员,看网页全靠Ctrl+F搜关键词。现在Qoder直接给它配了副带望远镜功能的眼镜,网页上的按钮、输入框、下拉菜单,看得一清二楚。

而且支持开发者模式,这意味着Agent能看到网页的DOM结构。就像你相亲的时候,对方不仅看了你的朋友圈,还顺手翻完了你三年前的微博。

透明,彻底透明。

💡 冷知识:很多AI工具说能"看网页",其实看的是纯文本截图。Qoder这个是真·浏览器内核,能执行JavaScript、能渲染CSS、能点按钮。差距大概相当于"看照片"和"亲自到场"的区别。

Chrome Devtools MCP:不用登录的"偷窥神器"

第二招,给Qoder装上Chrome Devtools MCP。

这玩意儿是干嘛的?简单来说,就是让Qoder能直接调用Chrome的开发者工具协议。

对于那些不需要登录就能看的网页,Qoder现在可以像老司机一样熟练操作:点这里、填那里、下拉选这个、然后点提交。

想象一下,你让AI去查个公开的数据,以前它可能会说:“抱歉,我无法访问外部链接。”

现在呢?AI默默打开浏览器,输入网址,等页面加载完,精准定位到你想要的数据,复制,粘贴,完事。

整个过程行云流水,比你家猫偷吃罐头还熟练。

当然,这招对需要登录的场景暂时还没辙。毕竟AI再聪明,也不能凭空猜出你的密码——除非你把密码设成"123456",那当我没说。

🔧 适用场景:查公开文档、爬取无需认证的数据、自动化测试公开页面、批量填表(不用登录的那种)。

QoderWork插件:Agent终于长出了"手"

第三招,也是我觉得最骚的一招——安装QoderWork的Chrome浏览器插件。

这个插件的作用,是让Agent操作浏览器的方式,和你一模一样。

注意关键词:一模一样

不是那种后台发HTTP请求的"伪操作",而是真的移动鼠标、真的点击、真的输入、真的滚动页面。

这意味着什么?意味着网站根本分辨不出来这是人还是AI。

你的反爬机制?AI现在和你一样,会看验证码、会等页面加载、会处理弹窗。那些专门防爬虫的"你是机器人吗"验证,对Qoder来说就像问你"你是人类吗"一样侮辱性极强。

毕竟,它现在操作浏览器的方式,和你周末躺床上刷淘宝的姿势,完全一致。

鼠标移到搜索框,点击,输入关键词,回车,等结果出来,点第一个链接,下滑看内容,复制想要的信息。

这一套组合拳打下来,网站后台的日志里只会记录:“今天有个用户访问了这些页面。”

至于这个"用户"是碳基生物还是硅基生物,日志表示:我不道啊。

这玩意儿到底能干嘛?

举个栗子。

你让AI去某招聘网站搜集"Java工程师"的岗位要求。以前,AI可能只能给你个链接,说:“你自己去看吧。”

现在呢?AI打开浏览器,输入网址,搜索"Java工程师",一页一页翻,把每个岗位的要求、薪资、地点,全给你整理成表格。

你喝着咖啡刷着短视频,回来一看,AI已经把竞品分析做完了。

这感觉,就像雇了一个不吃不喝不休息、不要五险一金、还不会跟你顶嘴的实习生。

唯一的区别是,这个实习生不会在你背后吐槽你。

⚠️ 温馨提示:虽然Qoder很强,但请大家合法合规使用。不要拿它去爬人家的付费内容,也不要用来刷票。咱们技术人,要有技术人的底线。除非……除非对方先动的手。

写在最后

22年前,我刚入行的时候,写个爬虫要手写正则,处理反爬要研究HTTP头,模拟登录要抓包分析Cookie。

那时候要是有人跟我说,未来会有一个AI,能像人一样操作浏览器,我肯定会让他去医院挂个精神科。

现在呢?Qoder不仅做到了,还做得挺优雅。

内置浏览器解决"看"的问题,Devtools MCP解决"简单操作"的问题,QoderWork插件解决"复杂交互"的问题。

三板斧下来,Agent的联网能力直接从"2G信号"升级到了"光纤入户"。

不过话说回来,工具再强,也得看用的人。

就像给你一把屠龙刀,你拿去切菜,那它也就是把比较锋利的菜刀。

Qoder的Browser Use已经摆在这儿了,怎么用、用到什么程度,就看各位的想象力了。

反正我已经开始让它帮我自动整理技术文档了。

毕竟,22年的老腰,真的经不起久坐了。

P.S. 目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步,增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。注意,教程仅限真正想入门AI的朋友,否则看看零散的博文就够了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值