Claude Sonnet 4.5:AI编码的新王者?

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

今天一早,Anthropic扔出了一颗重磅炸弹——Claude Sonnet 4.5正式发布。官方的措辞相当自信,直接宣称这是”世界上最好的编码模型”,在构建复杂Agent、电脑使用能力、推理和数学方面都有显著提升。

说实话,当我看到这些claim的时候,心里是有点半信半疑的。毕竟这个行业见多了”最强模型”的宣传话术。刚刚测试下来,我的第一感觉是:这玩意儿在写代码方面,确实比我之前最爱用的GPT-5-Codex还要好使。

当然了,这个行业的迭代速度快得吓人。据说Gemini 3马上就要来了,谁知道Sonnet 4.5这个”最强编码模型”的宝座能坐多久呢?

价格依然亲民

先说说大家最关心的价格。Sonnet 4.5维持了上一代的定价:输入token 3美元/百万,输出token 15美元/百万。这个价格比Claude Opus(15/75美元)要便宜得多,不过相比GPT-5和GPT-5-Codex(都是1.25/10美元)还是贵了一些。

如果你想体验Claude Sonnet 4.5,但又不想处理复杂的API配置和付费问题,可以试试chatshare镜像站。在这里你不仅能用到Claude全系列模型,还能同时访问ChatGPT、Grok、Gemini等各种订阅模型,一个账号搞定所有主流AI,省心省力。

如果说需要使用AI编程工具,最近另一个值得关注的是gaccode。Claude刚上架了Claude Code功能,而gaccode就是一个把Claude Code和ChatGPT Codex整合在一起的平台,价格极其良心,直接对标Claude Max和ChatGPT Pro。如果你经常需要AI辅助编程,这个平台真的可以帮你省下不少订阅费。

两个站点的介绍都能够在找到。

Claude.ai的代码解释器,才是真正的杀手锏

让Sonnet 4.5真正发光发热的,是Claude.ai网页版最近加入的代码解释器功能(iPhone原生App还没有)。三周前我就详细写过这个功能,但配合4.5用起来,体验完全不一样。

相比ChatGPT的代码解释器,Claude的实现更加强大——它可以直接从GitHub克隆代码,还能从NPM和PyPI安装软件包。这听起来可能没什么,但实际用起来,这意味着你可以让AI做更复杂的事情。

简单测试

我给Sonnet 4.5出了个难题。首先让它签出我的LLM项目:

Checkout https://github.com/XXXXX/llm 然后运行测试
pip install -e '.[test]'
pytest

它干净利落地完成了任务:克隆仓库、安装所有依赖、运行测试。466个测试全部通过,耗时167秒

然后我抛出了一个更疯狂的需求:

“这个工具把提示词和响应存在SQLite数据库里。现在是用一个conversation行配合线性的responses集合。我想让你尝试在responses表里加个parent_response_id字段,把对话结构改造成树形。用新的pytest测试来验证你的设计(单独执行测试以节省时间)。还要写个tree_notes.md文件,先写计划,再记录实现过程。”

接下来的场景简直像看大师级程序员在工作。它连续执行了几十次工具调用,自己设计数据库迁移、写工具函数、写测试、调试、优化。最终交付了一个完整的树形对话系统:

  • 数据库迁移脚本,向后兼容
  • 12个树操作工具函数(导航、分析、查询、可视化)
  • 16个全覆盖的测试用例(全部通过)
  • 7个完整的文档文件

更夸张的是,我全程都是在手机上输入指令的。最后我说”给我打包一个zip文件”,它就真的把所有成果打包好了。

经典鹈鹕测试

作为惯例,我还是跑了经典benchmark:让它生成”骑自行车的鹈鹕”SVG图。

先试了带思维链的版本:

llm -m claude-sonnet-4.5 -o thinking 1 -o thinking_budget 4000
'Generate an SVG of a pelican riding a bicycle'

然后是不带思维链的:

llm -m claude-sonnet-4.5
'Generate an SVG of a pelican riding a bicycle'

两个版本都很不错——你能明显认出这是鹈鹕。不过说实话,自行车画得没有GPT-5-Codex好。

我还测试了图像理解能力,给它看了一张鹈鹕聚集的照片。它的描述相当准确:

“这张图片显示了一大群鹈鹕聚集在水岸边。鸟儿密密麻麻挤在一起,场面相当混乱,能看到几十只棕色鹈鹕。它们标志性的长喙和喉囊清晰可见。背景是平静的水面和深色的树线。光线暗示这是在清晨或傍晚拍摄的,给整个场景带来了温暖的金色调。这些鹈鹕似乎在休息或聚会,这是群居海鸟的典型行为。”

写在最后

Claude Sonnet 4.5在编码能力上确实有了质的飞跃。尤其是配合代码解释器使用时,它处理复杂任务的能力让人印象深刻。当然,AI模型的竞争永远不会停止,说不定下个月就有更强的模型出现。

但至少现在,如果你需要一个靠谱的AI编程助手,Sonnet 4.5绝对值得一试。

开启送礼物

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值