谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出

2024-10-05 12:40IT之家 - 故渊

IT之家 10 月 5 日消息,科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。

IT之家曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。

相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊天、转录和长文本翻译任务。

Gemini 1.5 Flash 8B 的另一个亮点是亲民的价格,相关计费将于 10 月 14 日星期一生效,IT之家附上相关信息如下:

  • 在低于 128K 上下文窗口下,每百万 tokens 输入提示词费用为 0.0375 美元(当前约 0.26 元人民币)

  • 在低于 128K 上下文窗口下,每百万 tokens 输出提示词费用为 0.15 美元(当前约 1.1 元人民币)

  • 在低于 128K 上下文窗口下,每百万 tokens 缓存提示词费用为 0.01 美元(当前约 0.071 元人民币)

作为对比,Gemini 1.5 Flash 模型的每百万输出 tokens 成本为 0.3 美元,这一价格是在 2024 年 8 月 12 日开始实施的,意味着新版 Gemini 1.5 Flash 8B 的价格相比较原版直接腰斩。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享