全球最佳编程 AI 模型：Claude Sonnet 4.5 登场，自主写代码超 30 小时、更像“一位同事”

2025-09-30 07:26IT之家 - 故渊

感谢IT之家网友软媒新友2203184、对的时间点的线索投递！

IT之家 9 月 30 日消息，Anthropic 今天（9 月 30 日）发布博文，宣布推出前沿 AI 模型 Claude Sonnet 4.5，并声称这是“世界上最好的编程模型”。

与以往模型主要用于构建原型不同，Claude Sonnet 4.5 的核心突破在于能够创建“生产就绪级”（production-ready）的应用程序，标志着 AI 在软件开发的可靠性上实现了显著飞跃。

在过去一年中，Anthropic 凭借其模型在软件工程任务上的卓越表现，已成为众多开发者和企业的首选。

据报道，苹果（Apple）和 Meta 等科技巨头内部均在使用 Claude 系列模型。Anthropic 同时也通过向 Cursor、Windsurf 等 AI 编程应用提供 API 访问权限，建立了稳固的商业模式。

然而，随着 OpenAI 近期推出的 GPT-5 在多项编程基准测试中超越 Claude，Anthropic 在该领域的领先地位正面临严峻挑战。此次发布 Claude Sonnet 4.5，显示了其巩固市场优势、直面竞争的决心。

Anthropic 表示，Claude Sonnet 4.5 在包括 SWE-Bench Verified 在内的多个行业标准编程基准测试中取得了业界领先的性能。

公司 AI 研究员 David Hershey 还向 TechCrunch 透露，仅凭基准测试分数难以完全体现该模型的真实能力。他观察到，在部分企业客户的早期试用中，Claude Sonnet 4.5 能够自主编程长达 30 小时。

Anthropic 联合创始人兼首席科学官贾里德・卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示：“人们注意到了这种模型，因为它更智能，更像同事，遇到问题并解决问题时与它一起工作很有趣。”

在此期间，模型不仅成功构建了一款应用，还独立完成了数据库服务搭建、域名购买以及确保产品安全的 SOC 2 审计等一系列复杂任务。

新模型的强大能力也获得了行业合作伙伴的高度评价。编程工具 Cursor 的首席执行官 Michael Truell 表示，Claude Sonnet 4.5 代表了最先进的编码性能，尤其擅长处理长周期的复杂任务。

IT之家援引博文介绍，Anthropic 为配合新模型发布，还推出了 Claude 智能体软件开发工具包（Claude Agent SDK），旨在帮助开发者构建自己的定制化 AI 智能体。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。