【新智元导读】OpenAI 首届开发者大会开启前,ChatGPT 各种爆料已出,全新 UI 界面,人人可定制 GPT,将引领「智能体工程师」新职业诞生。另一边,马斯克自家的 xAI 大模型也开启了大范围内测。
OpenAI 首届开发者大会,开启了倒计时!
还记得周一,OpenAI 悄无声息地解禁了 ChatGPT 的两大能力:一是上传 PDF、数据文档等文件,另一个是无需转换即可使用所有工具。
这不,OpenAI 开发者论坛上,已经有网友发现「GPT-4(ALL Tools)」开始灰度测试了。而且 ChatGPT 界面也有了不同的变化。
简单来说,就是把之前 ChatGPT Plus 的几个单独选择的功能全部集合到一起,让它可以同时联网,调用代码解释器,DALL-E 3,以及使用各种插件。
而另一边,马老板流量加持的 xAI 推出了第一个 AI 助手 ——「Grok」,已经开始了小范围的测试。
X 上网友纷纷晒出了自己的「Grok 初体验」。
网友贴出自己通过 X Premier + 获得了体验 Grok 的机会,问了一个关于 X 上最火的几个账户的问题,结果是 Grok 可以根据 X 上的数据进行实时的回复。
值得一提的是,GPT-4(ALL Tools)配上了 32k 上下文窗口。
但是如果我们单独使用 DALL・E 3、浏览器等工具,仅有 8k 的上下文窗口。
具体信息,可以从代码图中看出:
已经开启权限的网友开始了试玩。
天津师范大学副教授 Wang Shuyi 表示,GPT-4 (All Tools)打通各个模式之后,拿来当助教非常合适。你可以让它识别幻灯帮你讲解,还能立即给你写出程序代码的例子来。
还有人表示,使用 GPT-4 功能全程无受限。
以图绘图不再是梦。
有网友直接给出提示:查找人口最多的国家的最新人口数据,在该国穿着民族服装的人持有的板上显示价值,并列出来源。
然后,ChatGPT 通过「网络浏览」确定了印度和 1,425,775,850 的人口。不过,DALL・E 3 尝试了几次才(几乎)在图像上显示字母。
再来一个例子:
如上,我们看到的是 ChatGPT 即将迎来更新的一部分能力。
在 OpenAI 开发者大会还未开启之前,已经有各种风格消息曝出 ChatGPT 将迎来重大更新,甚至面向开发者的 API 更加优惠。
具体包括:
全新的 UI 界面 —— 新的 ChatGPT 原型 Gizmo V8,知识截止日期为 2023 年 4 月。
定制聊天机器人
首先,OpenAI 将发布专门用于创建、管理和选择自定义聊天机器人的 Gizmo 工具,功能:
- 沙盒测试:提供导入、测试和修改现有聊天机器人的环境
- 自定义操作:使用 OpenAPI 规范为聊天机器人定义附加功能
- 知识文件添加:添加聊天机器人可参考的其他文件
- 基本工具:提供浏览网页、创建图片等基本工具
- 数据分析:查看和分析聊天机器人使用数据
- 草稿保存:为您创建的聊天机器人保存和共享草稿
- 发布:发布完成的聊天机器人
- 共享:设置和管理聊天机器人共享
- 市场:浏览和分享其他用户创建的聊天机器人
「Magic Creator」或「Magic Maker」
将协助用户通过互动界面定义聊天机器人,识别用户意图,实时测试,并通过对话迭代修改聊天机器人的行为。
- 通过互动界面定义聊天机器人
- 识别用户意图并创建聊天机器人
- 实时测试创建的聊天机器人
- 通过迭代对话修改聊天机器人行为
- 共享和部署聊天机器人
更多详细的信息如下图:
还有 ChatGPT 的终极工具箱。
工作空间和团队计划提供了新的企业订阅和工作空间管理功能
团队计划以每月 30 美元的价格提供,年订阅为每月 25 美元,但至少需 3 名用户。
最低月费用达到 90 美元,提供无限制快速 GPT-4 访问、更长上下文和高级数据分析模型的无限使用等额外好处。
工作空间功能为个人和工作空间提供了分隔,并允许定义角色、部门或其他元数据,预计可以整合外部 ERP 和 CRM 系统。
ChatGPT「上下文连接器」
可以链接 Google Drive 和 Microsoft 365,使文件、表格或演示文稿能够附加到聊天中或用作对话的上下文。
英伟达高级科学家 Jim Fan 表示,我要去参加 OpenAI 开发者日!如果泄漏属实,这将是人工智能消费市场的关键时刻:
OpenAI 正在成为一个成熟的 UGC 平台,用户可以在其中创建和共享任何 AI Agents。它将包括 RPA、角色 AI、插件存储等等功能。市场将销售 BEHAVIOR,而不是像 Wolfram Alpha 这样的软件扩展。
将有一些工具可以帮助任何用户在沙盒中快速构建和测试 agent,可以访问插件、浏览器、本地文件和远程文件(通过 GDrive / Microsoft 连接器)。
机器人的行为不会通过 SDK 进行编程,而是通过简单的迭代聊天进行编程。我觉得这特别有趣,因为它大大降低了门槛。
你无需编码或编写系统提示,而是通过对话询问和完善您想要的内容。我想 agent 也可以提出后续和澄清问题,因为它正在「在上下文中训练」。它与 DALLE・3 的直观界面一致,类似于我们作为人类入职新员工的方式。
一切似乎都离 Karpath 认为的「GPT 作为新操作系统」的愿景更近了一步。如果市场和收入分享模式真正起飞,「Agent Devs」将是一个新的职业,就像「iOS Devs」一样。
还有大 V 认为,如果 OpenAI 新功能的泄露属实,「Agents 开发者」将会变成继 iOS 开发之后的新职位。
根据 X 上一位大 V 的爆料和总结,到目前为止 Grok:
- 支持 SuperPrompt 的上下文窗口的大小大约是 25k 的 token
- 响应时间会非常快
-个性鲜明,搞笑且机智,远离枯燥的「政治正确」
-目前微调的数据来源是 886.03 GB 版本的「The Pile」数据库,以及整个 X 平台的海量数据
-「实时」搜索引擎,数据来源优先从 X 上获取
- API 功能确定会推出。
- 支持语音输入提示词,输出回复
- 图像生成,图像识别,语音识别等多模态未来一定会支持,当前模型已经有相关的一些能力。
-轻量版 Grok 可以在特斯拉上本地化部署运行。
这位网友在获得体验资格之后,先和 Grok 来了一场骂战,结果是 Grok 大获全胜,马老板亲自回复:笑哭。
而在目前公开的主流 LLM 服务中,似乎只有独此一家可以满足这个需求。
而大部分吃瓜网友,对马老板号称能「探究这个世界真相的」AI 助手,还是相当看好的,虽然没有人用过,但是已经有 1/4 的网友相信,它半年内就会成为最领先的大预言模型。
看来网友对于 xAI 还是有一股「谜之他信」,虽然现在大部分的网友目前都没办法体验「Grok」,但是很多网友对它已经非常期待。
一位初创公司的 CEO 表示,就名字而言,就已经薄纱了现在所有的 LLM,Grok 代表着的「顿悟」,非常有品味。
已经被大模型政治正确搞得很厌烦的网友,似乎非常期待获得一个性能强劲,性格又不那么死板的 AI 助手了。
那么,代价是什么呢?
马老板也官宣了 Grok 的早期获取方式 —— 订阅「 𝕏 Premium Plus」,每月只要 16 刀。不过现在还是处于灰度测试阶段,等到测试完毕,订阅用户才能全面可用。
马斯克宣布 xAI 的 Grok 人工智能助手将直接包含在 𝕏 Premium Plus 中,并补充说现有 X 用户可以每月花费 16 美元来进行订阅。
不过很多网友对于马老板在收费上的出尔反尔,同样表示了不理解。
很多花钱买了小蓝标认证的用户,依然得不到新功能的提前预览,要求给个解释。
参考资料:
https://community.openai.com/t/got-access-to-gpt-4-alpha-on-free-version-of-chatgpt/468313/6
https://twitter.com/DrJimFan/status/1720834990198620275
https://the-decoder.com/openais-massive-chatgpt-updates-leak-ahead-of-developer-conference/
本文来自微信公众号:新智元 (ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。