全球最佳编程 AI 模型:Claude Sonnet 4.5 登场,自主写代码超 30 小时、更像“一位同事”

2025-09-30 07:26IT之家 - 故渊
感谢IT之家网友 软媒新友2203184对的时间点 的线索投递!

IT之家 9 月 30 日消息,Anthropic 今天(9 月 30 日)发布博文,宣布推出前沿 AI 模型 Claude Sonnet 4.5,并声称这是“世界上最好的编程模型”。

与以往模型主要用于构建原型不同,Claude Sonnet 4.5 的核心突破在于能够创建“生产就绪级”(production-ready)的应用程序,标志着 AI 在软件开发的可靠性上实现了显著飞跃。

在过去一年中,Anthropic 凭借其模型在软件工程任务上的卓越表现,已成为众多开发者和企业的首选。

据报道,苹果(Apple)和 Meta 等科技巨头内部均在使用 Claude 系列模型。Anthropic 同时也通过向 Cursor、Windsurf 等 AI 编程应用提供 API 访问权限,建立了稳固的商业模式。

然而,随着 OpenAI 近期推出的 GPT-5 在多项编程基准测试中超越 Claude,Anthropic 在该领域的领先地位正面临严峻挑战。此次发布 Claude Sonnet 4.5,显示了其巩固市场优势、直面竞争的决心。

Anthropic 表示,Claude Sonnet 4.5 在包括 SWE-Bench Verified 在内的多个行业标准编程基准测试中取得了业界领先的性能。

公司 AI 研究员 David Hershey 还向 TechCrunch 透露,仅凭基准测试分数难以完全体现该模型的真实能力。他观察到,在部分企业客户的早期试用中,Claude Sonnet 4.5 能够自主编程长达 30 小时。

Anthropic 联合创始人兼首席科学官贾里德・卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:“人们注意到了这种模型,因为它更智能,更像同事,遇到问题并解决问题时与它一起工作很有趣。”

在此期间,模型不仅成功构建了一款应用,还独立完成了数据库服务搭建、域名购买以及确保产品安全的 SOC 2 审计等一系列复杂任务。

新模型的强大能力也获得了行业合作伙伴的高度评价。编程工具 Cursor 的首席执行官 Michael Truell 表示,Claude Sonnet 4.5 代表了最先进的编码性能,尤其擅长处理长周期的复杂任务。

IT之家援引博文介绍,Anthropic 为配合新模型发布,还推出了 Claude 智能体软件开发工具包(Claude Agent SDK),旨在帮助开发者构建自己的定制化 AI 智能体。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        分享成功

        长按关注IT之家公众号
        阅读更多精彩文章

        查看更多原创好文
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享