Claude Sonnet 4.5：AI编码的新王者？

最新推荐文章于 2026-06-18 14:16:48 发布

原创最新推荐文章于 2026-06-18 14:16:48 发布 · 1.2k 阅读

13 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #gpt #chatgpt #ai #Claude

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

今天一早，Anthropic扔出了一颗重磅炸弹——Claude Sonnet 4.5正式发布。官方的措辞相当自信，直接宣称这是”世界上最好的编码模型”，在构建复杂Agent、电脑使用能力、推理和数学方面都有显著提升。

说实话，当我看到这些claim的时候，心里是有点半信半疑的。毕竟这个行业见多了”最强模型”的宣传话术。刚刚测试下来，我的第一感觉是：这玩意儿在写代码方面，确实比我之前最爱用的GPT-5-Codex还要好使。

当然了，这个行业的迭代速度快得吓人。据说Gemini 3马上就要来了，谁知道Sonnet 4.5这个”最强编码模型”的宝座能坐多久呢？

价格依然亲民

先说说大家最关心的价格。Sonnet 4.5维持了上一代的定价：输入token 3美元/百万，输出token 15美元/百万。这个价格比Claude Opus（15/75美元）要便宜得多，不过相比GPT-5和GPT-5-Codex（都是1.25/10美元）还是贵了一些。

如果你想体验Claude Sonnet 4.5，但又不想处理复杂的API配置和付费问题，可以试试chatshare镜像站。在这里你不仅能用到Claude全系列模型，还能同时访问ChatGPT、Grok、Gemini等各种订阅模型，一个账号搞定所有主流AI，省心省力。

如果说需要使用AI编程工具，最近另一个值得关注的是gaccode。Claude刚上架了Claude Code功能，而gaccode就是一个把Claude Code和ChatGPT Codex整合在一起的平台，价格极其良心，直接对标Claude Max和ChatGPT Pro。如果你经常需要AI辅助编程，这个平台真的可以帮你省下不少订阅费。

两个站点的介绍都能够在找到。

Claude.ai的代码解释器，才是真正的杀手锏

让Sonnet 4.5真正发光发热的，是Claude.ai网页版最近加入的代码解释器功能（iPhone原生App还没有）。三周前我就详细写过这个功能，但配合4.5用起来，体验完全不一样。

相比ChatGPT的代码解释器，Claude的实现更加强大——它可以直接从GitHub克隆代码，还能从NPM和PyPI安装软件包。这听起来可能没什么，但实际用起来，这意味着你可以让AI做更复杂的事情。

简单测试

我给Sonnet 4.5出了个难题。首先让它签出我的LLM项目：

Checkout https://github.com/XXXXX/llm 然后运行测试
pip install -e '.[test]'
pytest

它干净利落地完成了任务：克隆仓库、安装所有依赖、运行测试。466个测试全部通过，耗时167秒。

然后我抛出了一个更疯狂的需求：

“这个工具把提示词和响应存在SQLite数据库里。现在是用一个conversation行配合线性的responses集合。我想让你尝试在responses表里加个parent_response_id字段，把对话结构改造成树形。用新的pytest测试来验证你的设计（单独执行测试以节省时间）。还要写个tree_notes.md文件，先写计划，再记录实现过程。”

接下来的场景简直像看大师级程序员在工作。它连续执行了几十次工具调用，自己设计数据库迁移、写工具函数、写测试、调试、优化。最终交付了一个完整的树形对话系统：

数据库迁移脚本，向后兼容
12个树操作工具函数（导航、分析、查询、可视化）
16个全覆盖的测试用例（全部通过）
7个完整的文档文件

更夸张的是，我全程都是在手机上输入指令的。最后我说”给我打包一个zip文件”，它就真的把所有成果打包好了。

经典鹈鹕测试

作为惯例，我还是跑了经典benchmark：让它生成”骑自行车的鹈鹕”SVG图。

先试了带思维链的版本：

llm -m claude-sonnet-4.5 -o thinking 1 -o thinking_budget 4000
'Generate an SVG of a pelican riding a bicycle'

然后是不带思维链的：

llm -m claude-sonnet-4.5
'Generate an SVG of a pelican riding a bicycle'

两个版本都很不错——你能明显认出这是鹈鹕。不过说实话，自行车画得没有GPT-5-Codex好。

我还测试了图像理解能力，给它看了一张鹈鹕聚集的照片。它的描述相当准确：

“这张图片显示了一大群鹈鹕聚集在水岸边。鸟儿密密麻麻挤在一起，场面相当混乱，能看到几十只棕色鹈鹕。它们标志性的长喙和喉囊清晰可见。背景是平静的水面和深色的树线。光线暗示这是在清晨或傍晚拍摄的，给整个场景带来了温暖的金色调。这些鹈鹕似乎在休息或聚会，这是群居海鸟的典型行为。”

写在最后

Claude Sonnet 4.5在编码能力上确实有了质的飞跃。尤其是配合代码解释器使用时，它处理复杂任务的能力让人印象深刻。当然，AI模型的竞争永远不会停止，说不定下个月就有更强的模型出现。

但至少现在，如果你需要一个靠谱的AI编程助手，Sonnet 4.5绝对值得一试。

开启送礼物

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅