.hd-box .hd-fr

Claude 3.5 编程收入暴增 10 倍,抢走 Cursor 反杀 OpenAI

2024-12-15 13:14新智元(新智元)0评

OpenAI 有许多紧追不舍的竞争对手,但没有哪家能像 Anthropic 这样让 OpenAI 的高管们寝食难安。

曾几何时,AI 编程既是 OpenAI 的优势领域,也是数百万用户订阅 ChatGPT 的主要原因之一。

然而,就在今年 7 月,曾获得 OpenAI 800 万美元投资的明星初创 Cursor,毅然决然地将其 AI 编程助手的默认模型从 GPT 换成了 Claude。

不仅如此,Cursor 的联合创始人 Aman Sanger 更是在 Lex Fridman 10 月的播客上对 anthropic 大加称赞:

「得益于对用户需求更深入的理解,最新版的 Claude 3.5 Sonnet 可以说是当前『最佳』的编程工具。」

无独有偶,OpenAI 也在初秋的时候通过内部基准测试发现,自家模型在自动编程任务上已经被 Anthropic 狠狠地甩在了身后。

所有这些,让 OpenAI 的领导层大为震惊。

眼瞧着 Anthropic 在编程领域的成功,正在飞速转化为商业成果 —— 近 3 个月来,公司来自软件开发和代码生成业务的年化收入实现了 10 倍的增长。

为了遏制这一势头,OpenAI 开始紧急对自家模型的编程能力进行提升。

OpenAI 需要警惕的不止有 Anthropic,还有刚发布了 Gemini 2.0 的谷歌,和造出世界最强超算的 xAI

不过,成立时间比 Anthropic 早五年的 OpenAI,依然在营收上仍保持着显著优势:OpenAI 今年预计营收约 400 亿美元,是 Anthropic 的 5 倍之多。

从规模上看,OpenAI 也远超 Anthropic:OpenAI 累计筹集 2000 亿美元资金,最高估值达 1570 亿美元,而 Anthropic 的融资额为 110 亿美元,最高估值为 180 亿美元。

在财务状况方面,OpenAI 同样更具优势:OpenAI 与云供应商微软的分成比例,要比 Anthropic 与亚马逊之间的更低。

由于开发和运营 AI 技术的成本极其高昂,OpenAI 和 Anthropic 今年都在大规模烧钱,规模均达数十亿美元。

此外,OpenAI 还计划开发自己的数据中心芯片和其他硬件设施,从而降低对外部供应商的依赖度。这意味着公司在可预见的未来仍需持续寻求资金支持。

在过去的开发中,Anthropic 始终保持着一道自我约束:对安全性的高度重视。

这里的「安全性」是指,AI 公司为防止模型出现重大失误,或者采取危及人类生命的行为 —— 比如自主研发生物武器或实施核打击。(公司主动将模型提供给美国军方使用不算)

Anthropic 的 7 位联合创始人都曾在 OpenAI 任职,但由于对 AI 安全性的担忧,他们于 2020 年底选择离开。

根据 Anthropic 首席执行官 Dario Amodei 透露,公司早在 2022 年夏季就已经开发出了 AI 聊天机器人,但他们当时选择了继续进行安全性测试,而不是仓促发布。

2022 年 11 月,OpenAI 发布 ChatGPT,瞬间引发了业界和大众的轰动。四个月后,Anthropic 才推出了他们的 Claude。

最近,Anthropic 在挑战 OpenAI 这个巨兽时,愈发大胆。

今年 10 月,在包括首席技术官 Mira Murati 在内的多位高管离开 OpenAI 后,Anthropic 在旧金山国际机场投放了 Claude AI 的广告,暗讽道:「这是一个没有戏剧性的选择。」

在实验性产品发布方面,也更为果断。

10 月,尽管公司在博客中承认存在潜在的网络安全风险,但仍推出了一项创新性的功能 ——Computer Use。

也就是,让 Claude 模型能够像人类一样操作计算机,不仅可以查看屏幕、移动光标,还可以单机按钮、键入文本!

这一举动在 OpenAI 内部引发了嘲讽。

在最近的一次会议上,OpenAI 的领导层讽刺了 Anthropic 的这一决定,认为这与他们大肆宣扬的 AI 安全理念背道而驰。

创始人背后另一段恩怨,项目之争私建小组

实际上,Anthropic 和 OpenAI 两家公司的恩怨,远比外界所知道的要复杂得多。在因 AI 安全理念分歧而分道扬镳之前,创始人之间的矛盾早就埋下了种子。

作为 OpenAI 的研究副总裁,Dario Amodei 曾领导开发了 GPT-2、GPT-3 模型。而且,他还联手 OpenAI、谷歌 DeepMind 等研究人员,共同撰写了一篇关于基于人类反馈强化学习(RLHF)的开创性论文。

论文地址:https://arxiv.org/pdf/1706.03741

这项突破性技术极大推动了对话式 AI 的进步,让人类能够直接参与 AI 模型的优化和改进。

据透露,在任职期间,Dario 和 Daniela Amodei 与其他高管之间产生了严重分歧。尤其是,与 Altman 和 Greg 在项目领导权和安全问题上的争执。

左:Dario Amodei;右:Daniela Amodei(Dario 的妹妹、Anthropic 总裁)

2019 年初,一个看似平常的项目申请,成为了日后产生分裂的导火索。

当时,Greg 正主导开发一个能够玩在线对战游戏 Dota 2 的 AI 项目。随后,他希望加入 Dario Amodei 负责语言生成 GPT 模型团队。

这个模型后来成为了 ChatGPT 等爆款产品的基础技术。

令人意外的是,Amodei 兄妹直接否决了 Greg 加入项目的请求。他们对其他员工解释,Greg 素有难以合作的名声,经常在未经沟通的情况下随意修改代码。

随之,矛盾升级的程度,更是令人咋舌。据一位 OpenAI 前员工透露,在他们离职前的数月时间里,Amodei 兄妹与 OpenAI 其他成员之间的裂痕日益加深。

Amodei 甚至创建了一个只有特定研究人员进入的私密 Slack 讨论组,直接将 Altman、Greg 等公司高层排除在外。

这种近乎决裂的行为,预示着团队的分裂不可避免。在今年 11 月的一期播客节目中,Dario Amodei 在谈及这段经历时,做出了颇具深意的阐述。他坦言,最终的分道扬镳源于对 AI 安全开发根本理念的不同。

「如果你对实现目标有自己的理念,就应该去追求和实现它。试图说服别人改变他们的想法,这样做是极其低效的」。

最终,Amodei 兄妹选择出走 OpenAI,创立了 Anthropic 这家公司。自此之后,Greg 也参与到了 GPT 项目中来。

Information 统计了所有离职 OpenAI 加入 Anthropic 的成员名单,其中既有联创、安全项目负责人这样的大佬,也有普通研究员的加盟。不算 Amodei 兄妹两人,还有 8 位 OpenAI 员工纷纷叛逃。

商业王牌:不炫技,只求专注

成立于 2021 年,Anthropic 用了 2 年时间才走进了人们的视野。

它的发展重点与 OpenAI 存在着微妙的差异。这也在一定程度上,解释了为什么 Anthropic 能在商业客户市场上稳步推进。

提前出世爆红的 ChatGPT 在用户青睐上,有着先天的优势。Claude 的使用量远低于 ChatGPT 也是合情合理,为此,Anthropic 将研究重心转向了如何更有效地向企业客户和开发者推广 Claude 模型。

与 OpenAI 追求多模态、复杂推理模型不同,Anthropic 选择的是一条更为稳健的道路。在 Anthropic 公司领导层看来,「这些看似简单的功能,实际上却能改变整个游戏规则」。

不仅如此,Anthropic 的 Jensen 也指出,目前大多数企业都在致力于将 AI 技术整合到现有产品中。这需要更大的上下文等功能支持,这些功能虽然听起来不够炫酷,却能带来实质性的改变。

比如文本摘要、内容生成和智能客服等。另外,ChatGPT 用户对推理模型的低使用率,也似乎佐证了这一判断。

可见,Anthropic 公司战略非常清晰,将更多资源投入到解决企业真实的痛点之上。鉴于此,他们重点朝着以下几个方面发力:

大模型之战,Claude 突围

事实证明,这种务实的策略,市场前景十分巨大。

像云协作创业公司 Airtable、法律研究公司 LexisNexis 这样重量级客户,已经开始大规模采用 Claude。

Airtable 首席执行官 Howie Liu 表示,Claude 扩展的上下文窗口让员工能够上传完整的销售通话记录,AI 模型能更准确地捕捉对话中的微妙语气和客户投诉等细节信息。

更有趣的是,Liu 认为 Claude 回应比其他 LLM 更具「人性化」特征。这种微妙的差异,可能正是企业级应用中的致胜关键。

不过,他还提到,Airtable 此前也评测过 OpenAI 的模型,目前仍在其他应用场景中使用这些模型。

在法律领域,LexisNexis 也是一个重要的客户。

其首席技术官 Jeff Reihl 透露,公司约 60% 的 AI 功能都采用了 Claude,主要用于法律文件的起草和分析。

同样,Claude 扩展的上下文窗口在其中发挥了关键的作用。他还补充道,其余功能则采用 OpenAI 的 GPT-4 和 Mistral AI 等开源模型。

此外,最引人瞩目的案例来自客服公司 Intercom。

2023 年 10 月,Intercom 宣布将其客服工单处理 AI 聊天机器人 Fin 的底层技术,从 OpenAI 大模型切换为 Claude。

而数据说明了一切,Claude 在无需额外调整模型的情况下,将客服工单的自动解决率提升至 51%。

相比之下,2023 年 3 月首次推出、由 OpenAI 模型驱动的 Fin 的工单解决率仅为 23%。

这一显著提升可能不仅源于模型的更换,还受到其他因素的影响。不过,这对于追求效率的企业而言,无疑是一个振奋人心的突破。

值得一提的是,Anthropic 也宣布将采用 Fin 作为其客户服务 AI 智能体。

编程一手遮天,最抢手 Cursor 加入

另外,在编码自动化方面,Anthropic 相比 OpenAI 具有显著优势。

今年夏天,Anthropic 悄然交出了一份令业界惊艳的成绩单。随着 Claude 3.5 Sonnet 的发布,这家公司在代码自动化领域迅速跻身顶级阵营。

一家编程辅助工具初创公司 Augment CEOScott Dietzen 直言不讳道,在 2023 年夏季之前,我们仅使用开源模型开发产品。

他们表示,Claude 3.5 Sonnet 发布之后,其性能远超包括 OpenAI 在内的所有模型。尤其是,在需要深层理解和复杂推理场景中,这一优势尤为明显。

另一家代码辅助工具公司 Sourcegraph 也选择了 Claude 3.5 Sonnet 作为其默认模型。

他们的数据更为直观:用户有 66% 时间都偏爱 Anthropic 的模型,而非倾向于 OpenAI、谷歌等其他产品。

而且,在 Github 年度大会上,就连 OpenAI 最重要的合作伙伴微软,也官宣了在 GitHub Copilot 编程助手中添加 Claude、Gemini 的模型。

很少在公开场合谈论劲敌的奥特曼,却在一个月前活动中承认,毫无疑问,他们(Anthropic)开发出了一个在编程领域表现卓越的模型,这项工作令人印象深刻」。

剑拔弩张,Anthropic 反击时刻

近期种种迹象表明,Anthropic 已开始对 OpenAI 采取主动进攻策略。

公司的销售团队规模,较去年同期惊人暴增 500%。与此同时,销售团队的市场推广策略也发生了重大转变。

这背后,是 Anthropic 一场精心策划的市场反击。据一位亲历者透露,年初,Anthropic 的销售团队还相对低调。

他们坦诚告诉客户,大多数开发者正在使用 OpenAI 等竞争对手的模型,仅着重强调 Claude 在定制化模型开发等特定场景中的成本、性能优势。

而到了今年 6 月,随着新版 Claude 模型的发布,公司的销售策略更加明朗。销售团队主动出击,向客户强调 Claude 在年内多次技术迭代中已超越 OpenAI,并重点展示其在多个权威 AI 基准测试中的优异平均成绩。

并且,他们还获得了业界诸多大佬、开发者的认可。

Perplexity 首席执行官 Aravind Srinivas 的评价最为精彩,他认为,「Claude 3.5 Sonnet 堪称重大突破,这不仅对 Perplexity 意义重大,更对整个市场的诸多产品都产生了深远影响」。

更值得一提的是,Srinivas 进一步强调,「这个模型在逻辑推理能力方面实现了质的飞跃」。

Claude 3.5 超大杯虽不知何时面世,但 Anthropic 正在用技术实力,不断刷新突破的边界。

追赶 OpenAI,成为下一个 OpenAI。

参考资料:

本文来自微信公众号:新智元(ID:AI_era)

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论