谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4:包月 19.99 美元,84 页技术报告更新

【新智元导读】深夜,谷歌忽然放出复仇杀器。Bard、Duet AI,如今都成了历史的尘埃。Gemini 既是模型,也是产品,谷歌推向全世界的 AI,在昨夜正式统一。

爆料成真了,谷歌的 Gemini 大杀器果然在昨天晚上炸了出来。谷歌正式官宣,Bard 更名为 Gemini。

从此,谷歌进入 Gemini 时代的新篇章。

与此同时,迄今为止最强的 Gemini Ultra 所加持的聊天机器人 Gemini Advanced 也在今天正式开放,所有人皆可访问。

从此,所有人都可以在谷歌办公全家桶中用到最强大模型 Gemini 了!

当然,这个最强机器人并不是免费的,需要月付 20 美金,前 2 个月可以免费使用。要知道,ChatGPT 每个月的收费就是 20 美元,谷歌此举是直接和 OpenAI 打擂台了。

此次谷歌不仅推出了大模型面向 C 端的 App,还将内部的多个产品接入大模型中。这样,谷歌的大模型就离公众又近了一步。

采取保守策略的谷歌,在去年一年被微软和 OpenAI 的重重险招打得找不着北,但最近的谷歌已经越来越大胆,誓要在产品和生态上攻城略地,扳回一局。

Gemini,进入谷歌全家桶

以前,或许你会为谷歌千千万万产品的名字感到困惑。但未来谈及谷歌的 AI 时,它们会汇合成同一个名字 —— Gemini

Gemini 既是模型名,也是产品名。既是聊天助手,又是聊天机器人,还是搜索引擎。

Bard 聊天机器人、安卓 Gemini 应用程序、Google Workspace 中的所有 Duet AI 功能,通通都整合到了 Gemini 品牌中。

在谷歌邮箱中,你能让它帮忙总结关于学校最近的邮件。

在 Gemini App 中,它能帮你根据照片写描述、发帖。

而迄今最强大模型 Gemini Ultra 1.0,更是强到发指。

每月 20 刀!Gemini 开始收费了

属于 Bard 的时代,已经不再了。

得到「地表最强」的模型 Gemini Ultra 加持后,Gemini Advanced 注定要成为受欢迎的聊天机器人之一。

谷歌博客介绍,借助 Ultra 1.0 模型,Gemini Advanced 在完成复杂任务方面,性能暴涨。比如,对于编程、逻辑推理、遵循复杂指令,以及参与创意项目的协作,胜任力近乎完美。

除此之外,Gemini Advanced 不仅可以开启更长、更详细的对话,还能更好地理解此前提出问题的上下文。

Gemini Advanced 能做的,或许并不比 ChatGPT 差。

它可以成为你的个人导师,为你量身订制分布教学、样本测验,或者讨论话题。面对更复杂的编码难题时,它能助你一臂之力,提供反馈意见,并帮你评估不同的编程方法。

它甚至可以为那些「数字内容创作者」从构思到实现,通过生成新内容、分析最新趋势,以及寻找增长受众的新方法。

当然了,正如此前爆料所称,Gemini Advanced 将开启收费模式:

价格为每月 19.99 美元,并提供两个月的免费试用。

这是谷歌全新的 Google One AI 高级订阅计划的一部分。

计划主要是为用户,提供 Google AI 最好、最顶尖的技术,同时包括 Google One Premium 存储空间优势,比如 2TB 的存储空间。

此外,AI Premium 用户不久很快就能够在 Gmail、Docs、Slides、Sheets 等产品中使用 Gemini(以前称为 Duet AI)。

谷歌表示,Gemini Advanced 初代版本已展示出强大的 AI 推理能力,未来还将持续优化。

目前,Gemini Advanced 现已在 150 多个国家和地区提供英语服务,之后会逐步扩展到更多语言。

需要明确的是,Bard 的全新升级可以理解为,是一次纯粹的「品牌」重塑,背后的模型本身并未改变。

早在去年 12 月初,谷歌就宣布了,Bard 背后的大模型从 PaLM 2 迭代为 Gemini。而这次,谷歌给聊天机器人的更名,更是将微软、OpenAI 视为强大的竞争对手。

AI 助手 Gemini 装进手机

此外,在手机端侧用上大模型、聊天机器人 Gemini,也是谷歌布局中的一步大棋。

同在今天,谷歌为 Gemini 和 Gemini Advanced 聊天机器人,分别引入了全新的安卓应用,以及 iOS 上的谷歌应用

以后,拿起手机只需呼唤一声「Gemini」。不论你身处何处,都可以通过输入、语音、甚至是图片寻求建议。

比如,出行的半路爆胎,你可以拍一张照片,问问 Gemini 如何处理棘手的难题。又或者,你想举办一个晚餐 party,却不知如何设计,找 Gemini 制作个性化图片,定制流程,准没错!

在谷歌看来:

这标志着我们正构建一个真正的 AI 助手的重要起点 —— 一个既能进行对话、支持多种交互方式又实用的助手。

Gemini 安卓版上线

Gemini 在安卓手机上也能下载了。

除了这种方式,你还可以选择使用 Gemini,替代原来的 Google Assistant,成为手机的默认语音助手。

然后你可以通过长按电源键、在手机上滑动屏幕到角落,或者说「hi Google」,激活 Gemini。这将为我们开启一个全新的手机体验,可以轻松访问 Gemini,并获得与当前屏幕内容相关的帮助。

举个栗子,随手拍一张小清新风格的照片,然后让 Gemini 生成描述。立刻,它生成了多个可用的描述供你选择,「多肉植物和点心」、「桌面静物」、「沙漠气息」.....

又或者拍一张狗狗照片,然后可以让 Gemini 为 Baxter 创建一个可爱的社交标题。

此外,通过 Gemini 应用,你还可以使用许多 Google Assistant 的语音功能,比如设置计时器、拨打电话和控制智能家居设备等等,

iOS 版也来了

在 iOS 设备上,谷歌将在未来几周通过 Google App 提供访问。只需点击 Gemini 切换按钮,即可开启对话。

它可以激发你的创意,创建定制图片,撰写社交媒体帖子,甚至在 Google App 中策划一场约会之夜。

许多网友已经迫不及待,剁手 20 刀体验最新的 Gemini Advanced。

「还是有些失望的」。

84 页超长技术报告更新

随着 Gemini Ultra 的正式上线,谷歌也同步更新了 Gemini 1.0 的技术报告

论文地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

在完成大规模预训练后,模型还需要通过后训练(post-training),即在已有的预训练模型基础上进一步训练,来拓展自己的能力(比如在编程和多语言处理领域)并增加更多的功能。

指令跟随

对于 LLM 来说,精准地执行用户的指令是一项基础能力。为此,谷歌采用了一种非常细致的方法来评估模型对每条指令的遵循程度。

具体评价标准有两个:

  • 1. 每条指令的准确率(评估集中遵循的子指令百分比)

  • 2. 完整响应的准确率(评估集中所有子指令都被遵循的指令百分比)

结果如表 14 所示,Gemini Advanced(Ultra)在每条指令的准确率上达到了接近 90% 的平均水平,相比 Gemini 和经过后训练的 PaLM 2 模型有显著的提升。

不过,Gemini Advanced(Ultra)在完全满足所有指令方面还有进一步的提升空间 —— 准确率只有约 54%。

多模态视觉

通过多模态后训练,Gemini 原生的多模态能力也得到了进一步加强,从而显著提升了模型在各种实用场景中的应用能力。

其中,得益于监督微调(SFT)带来的指令跟随能力的提升,Gemini Vision 模型的输出风格也更加贴近标准答案,并且成功地在多个测试集上(如 InfographicVQA、AI2D、VQAv2)实现了性能的提升。

代码

虽然基础模型在编程基准测试中表现得已经非常出色,但后训练数据还是显著提升了代码的质量和正确性。

而这也凸显了高质量示例数据和反馈数据对编程应用的重要性。其中,Gemini 采用的是人工和自动生成的混合数据。

SxS 得分显示,Gemini(Pro 版本)在使用了更新的后训练策略后,性能显著优于基于 PaLM 2 的旧版 Bard。而 Gemini Advanced(Ultra 版本)在此基础上进一步提升了性能。

老牌科技巨头的最后一搏

谷歌如此全力以赴并不奇怪,OpenAI、Anthropic、Perplexity 等强大的对手,都在虎视眈眈,蚕食着这家老牌科技公司的市场。

去年 Gemini 发布的测试中,Gemini 驱动的 Bard 性能很强,几乎和 GPT-4 相当,但速度明显较慢。

现在,谷歌急需证明自己能够跟上行业的步伐。两个难点在于:它既要打造一款引人注目的消费产品,又要试图说服开发者在 Gemini 上构建应用,而非 OpenAI 的模型

在谷歌的历史上,集全公司之力押注同一件事的情况,只有寥寥数次。比如,曾经的 Google Plus。

但这一次,谷歌似乎在使出洪荒之力,致力于成为一家 AI 公司。万物皆可 Gemini,会是谷歌撕开困境,给 OpenAI 猛力一击的开始吗?

参考资料:

本文来自微信公众号:新智元 (ID:AI_era)

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享