今天一早,Anthropic扔出了一颗重磅炸弹——Claude Sonnet 4.5正式发布。官方的措辞相当自信,直接宣称这是”世界上最好的编码模型”,在构建复杂Agent、电脑使用能力、推理和数学方面都有显著提升。
说实话,当我看到这些claim的时候,心里是有点半信半疑的。毕竟这个行业见多了”最强模型”的宣传话术。刚刚测试下来,我的第一感觉是:这玩意儿在写代码方面,确实比我之前最爱用的GPT-5-Codex还要好使。
当然了,这个行业的迭代速度快得吓人。据说Gemini 3马上就要来了,谁知道Sonnet 4.5这个”最强编码模型”的宝座能坐多久呢?

价格依然亲民
先说说大家最关心的价格。Sonnet 4.5维持了上一代的定价:输入token 3美元/百万,输出token 15美元/百万。这个价格比Claude Opus(15/75美元)要便宜得多,不过相比GPT-5和GPT-5-Codex(都是1.25/10美元)还是贵了一些。
如果你想体验Claude Sonnet 4.5,但又不想处理复杂的API配置和付费问题,可以试试chatshare镜像站。在这里你不仅能用到Claude全系列模型,还能同时访问ChatGPT、Grok、Gemini等各种订阅模型,一个账号搞定所有主流AI,省心省力。
如果说需要使用AI编程工具,最近另一个值得关注的是gaccode。Claude刚上架了Claude Code功能,而gaccode就是一个把Claude Code和ChatGPT Codex整合在一起的平台,价格极其良心,直接对标Claude Max和ChatGPT Pro。如果你经常需要AI辅助编程,这个平台真的可以帮你省下不少订阅费。
两个站点的介绍都能够在
找到。
Claude.ai的代码解释器,才是真正的杀手锏
让Sonnet 4.5真正发光发热的,是Claude.ai网页版最近加入的代码解释器功能(iPhone原生App还没有)。三周前我就详细写过这个功能,但配合4.5用起来,体验完全不一样。
相比ChatGPT的代码解释器,Claude的实现更加强大——它可以直接从GitHub克隆代码,还能从NPM和PyPI安装软件包。这听起来可能没什么,但实际用起来,这意味着你可以让AI做更复杂的事情。
简单测试
我给Sonnet 4.5出了个难题。首先让它签出我的LLM项目:
Checkout https://github.com/XXXXX/llm 然后运行测试
pip install -e '.[test]'
pytest
它干净利落地完成了任务:克隆仓库、安装所有依赖、运行测试。466个测试全部通过,耗时167秒。
然后我抛出了一个更疯狂的需求:
“这个工具把提示词和响应存在SQLite数据库里。现在是用一个conversation行配合线性的responses集合。我想让你尝试在responses表里加个parent_response_id字段,把对话结构改造成树形。用新的pytest测试来验证你的设计(单独执行测试以节省时间)。还要写个tree_notes.md文件,先写计划,再记录实现过程。”
接下来的场景简直像看大师级程序员在工作。它连续执行了几十次工具调用,自己设计数据库迁移、写工具函数、写测试、调试、优化。最终交付了一个完整的树形对话系统:
- 数据库迁移脚本,向后兼容
- 12个树操作工具函数(导航、分析、查询、可视化)
- 16个全覆盖的测试用例(全部通过)
- 7个完整的文档文件
更夸张的是,我全程都是在手机上输入指令的。最后我说”给我打包一个zip文件”,它就真的把所有成果打包好了。
经典鹈鹕测试
作为惯例,我还是跑了经典benchmark:让它生成”骑自行车的鹈鹕”SVG图。
先试了带思维链的版本:
llm -m claude-sonnet-4.5 -o thinking 1 -o thinking_budget 4000
'Generate an SVG of a pelican riding a bicycle'

然后是不带思维链的:
llm -m claude-sonnet-4.5
'Generate an SVG of a pelican riding a bicycle'

两个版本都很不错——你能明显认出这是鹈鹕。不过说实话,自行车画得没有GPT-5-Codex好。
我还测试了图像理解能力,给它看了一张鹈鹕聚集的照片。它的描述相当准确:

“这张图片显示了一大群鹈鹕聚集在水岸边。鸟儿密密麻麻挤在一起,场面相当混乱,能看到几十只棕色鹈鹕。它们标志性的长喙和喉囊清晰可见。背景是平静的水面和深色的树线。光线暗示这是在清晨或傍晚拍摄的,给整个场景带来了温暖的金色调。这些鹈鹕似乎在休息或聚会,这是群居海鸟的典型行为。”
写在最后
Claude Sonnet 4.5在编码能力上确实有了质的飞跃。尤其是配合代码解释器使用时,它处理复杂任务的能力让人印象深刻。当然,AI模型的竞争永远不会停止,说不定下个月就有更强的模型出现。
但至少现在,如果你需要一个靠谱的AI编程助手,Sonnet 4.5绝对值得一试。
开启送礼物

4813

被折叠的 条评论
为什么被折叠?



