.hd-box .hd-fr

火山豆包大模型价格清单公布:支持“预付 / 后付”双模式,号称“国内最高并发标准”

2024-05-21 10:33IT之家(漾仔)6评

IT之家 5 月 21 日消息,字节跳动在 5 月 15 日的“春季火山引擎 FORCE 原动力大会”中推出了豆包大模型(原名“云雀”),该模型主要面向行业场景,能够提供多种图文音频生成能力,IT之家整理如下:

今日火山引擎官网更新了豆包大模型的定价详情,号称“在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM、RPM 均达到国内最高标准”、“价格比行业低 99%,TPM 限额则达同规格模型的 2.7 倍到 8 倍”;此外,相关模型还可使用“预付费”、“后付费”模式:

以豆包通用模型 pro-32k 为例: 按照 “预付费”模型单元价格计算,10K TPM 的包月价格为 2000 元。10K*60*24*30=43200K。

即 432000K Tokens 的价格为 2000 元,平均价格为 0.0046 元 / 千 Tokens。按照“后付费”模式计算:在模型推理的计算成本中,推理输入通常占绝大部分比例,业界一般认为推理输入是输出的 5 倍。

根据豆包通用模型 pro-32k 推理输入 0.0008 元 / 千 Tokens、推理输出 0.002 元 / 千 Tokens 计算,模型推理的综合价格为 0.001 元 / 千 Tokens。

官方表示,国内其他竞品模型的 TPM 限额大多在 100K 到 300K 之间,RPM 则是在 60 到 120 区间,轻量级模型的 RPM 限额相对较高,但仅仅在 300 到 500 之间。按照 10K RPM 限额计算,企业客户平均每秒可以同时调用 167 次豆包通用模型,从而满足绝大多数业务场景在生产系统的大模型应用需求。

官方同时强调,相关标准已经达到 OpenAI 为高级别客户( Tier4 及 Tier5 等级客户)提供的 RPM 上限。在算力挑战更大的长文本模型上,豆包通用模型 pro 和 lite 的 128k 版本,模型限流为 1K RPM 和 400K TPM,同样大幅高于国内其他的 128k 长文本模型,能够帮助企业以较低成本使用大模型、加速大模型应用落地。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论