ChatGPT 化身生活操作系统:OpenAI 奥尔特曼预告下一代顶级 AI
- 量子位
2025-06-30 12:45
OpenAI 计划发布一个非常强大的开源模型。
它能够让人们在本地运行极其强大的模型,重新认识“本地部署”的可能性。
在旧金山 AI 初创学校对话中,奥尔特曼宣布了以上消息。这场对话由 Y Combinator 的首席执行官 Garry Tan 主持。
期间,他们还讨论了 OpenAI 的发展过程、未来方向、ChatGPT 的起源和 AI 硬件的构建。
奥尔特曼谈到,o3 模型上周的运行成本是本周的 5 倍,价格下降趋势还在继续,且 API 的成本将会持续大幅下降,开源模型将会非常棒。Chatgpt 的记忆功能不仅仅是一个小硬件,而是 AI 伴侣一般的存在。
未来,GPT-5 以及多种推理模型将往集成模型方向发展,并与 AI 智慧终端以及机器人连接,成为人们的生活操作系统。
他还说到,如果用户注册最高级别的 ChatGPT 订阅,将会给他们免费赠送一个机器人。
在不改变原意的基础上,在此做了以下整理。
GPT 推理模型的未来
Tan:最新的 o3 型号最让您感到惊讶的是什么,目前有哪些新兴行为或用例让您印象深刻?
奥尔特曼:我认为我们正处在一个非常有趣的时代。虽然目前我们还没有看到达到新的创新水平的推理模型产品,但是这个世界的模型能力已经进入了一种新的领域,我们仍然有大量全新的事物需要去构建。
我们很快就会推出一个令你们惊讶的开源模型。我认为它会比你希望的要好得多,你将能在本地运行非常强大的模型。同时,API 的成本将会持续大幅下降,开源模型将会非常棒。
Tan:对我来说,记忆甚至变成了一种与了解我的人对话的感觉,这很有趣。
奥尔特曼:是的,记忆是我们今年推出的我最喜欢的功能。
我认为这指向了我们希望产品的方向。那就是你将拥有一个实体,它可以了解你,连接到你所有的东西,并主动帮助你。
这不会像你发送一条消息然后它又回复你一条消息那样。它会一直运行,会查看你的东西,会知道何时向你发送消息,会知道何时为你做某事。
你会拥有特殊的新设备,它会集成到你使用的每项服务中,并且伴随你一生。
当这个系统在后台持续运行并不断向你推送内容时,这个交互区域会变得更加丰富。而当我们推出首款新设备时,这里还会新增更多功能或内容。
但我认为它的关键不在于那块小硬件,这个东西已经发展到可以在后台运行并感觉像是一种人工智能伴侣的程度。
Tan:我想我们看到 LMS 与真实数据集成的强大功能,我听说 MCP 即将登陆 OpenAI。实际的整合有什么令人惊讶的地方?你知道,在 YC 我们实际上内部拥有代理基础设施并且我们一直在使用它。
奥尔特曼:人们无疑开始使用 ChatGPT 作为操作系统,将他们的整个生活都融入其中。
整合尽可能多的数据源,以及始终伴随你的设备,例如新型网络浏览器,与所有数据源的连接、内存以及持续运行的模型,如果你把所有这些放在一起,它会是一个非常强大的地方。
Tan:您认为它未来会出现在云端,还是会出现在我们的桌面上,或者两者兼而有之?
奥尔特曼:会是所有这些的混合。人们肯定会为某些事情运行本地模型,如果我们可以将一半的聊天工作负载推送到本地设备上,没有人会比我们更高兴。至于云端部分,我认为我们很快就会运行世界上最大最贵的基础设施。
Tan:在云端运行,计算难度之大令你感到惊讶吗?
奥尔特曼:我们很擅长从零开始。就像两年半前我们还没有 ChatGPT.com 一样,现在已经发展成为世界第 5 大网站。
GPT-5 和多模态超级模型的愿景
Tan:o3、o4mini 推理模型与像 4o 这样的多模型并行发展,这两个线程汇聚在一起时会发生什么?GPT-5 及以后的愿景是什么?
奥尔特曼:我们无法通过 GPT-5 实现所有目标,但我们最终确实想要一个集成模型,它可以在需要时进行推理,并在需要时生成实时视频。
如果你问一个问题,你可以想象它会非常努力地思考,做一些研究,编写一堆代码,就像一个全新的应用程序供你使用。
我认为这像一种真正的新型计算机界面,AI 在某种程度上已经做到了这一点,但是当我们得到一个真正完整的多模态模型时,比如完美的视频、完美的编码及一切深度推理,感觉会非常强大。
Tan:这似乎是向具体化迈出的一步。你知道拥有视觉、语言和推理能力的机器人是我们想要的机器人的飞跃。
奥尔特曼:我们的策略是先解决这个问题,然后确保我们可以将其连接到机器人上。
但机器人的时代很快就要到来了,我想如果你注册最高级别的 ChatGPT 订阅时,我们会向你免费赠送一个机器人。
Tan:在现实世界拥有做实际工作的机器人,这是多么疯狂的未来。
奥尔特曼:我觉得我们离目标已经不远了。虽然机器人的机械工程非常复杂,AI 的认知能力也同样具有挑战性,但整体来看,我们正逐步掌握这些关键问题。
我认为几年后机器人就能做一些非常有用的事情,但制造十亿个机器人仍需要一段时间,我也不知道需要多少机器人能够完成自动化供应链,它们是否能运行整个供应链,比如驱动采矿设备、驱动集装箱轮船等。
Tan:谈到三级 AGI,AI agent,Greg Brockman 说最近是 agent 之年。有了操作员代码解释器这样的工具,你认为哪些类型的工作流程将会消失或者出现,但我们现在还没有做好准备。
奥尔特曼:长期以来,ChatGPT 像是 Google 的高级搜索版本,仍像是替代品。
但是现在你可以真正将一项任务交给 codeex 进行深入研究。它能够反馈相关建议,这就像一个初级员工可以在短时间做某项工作。
我认为使用当前的 o3 就能做到,更不用说我们下一个模型,你可以有很多这样的体验。
Tan:你如何看待人机交互和界面的未来?这些界面存在哪些局限性促使你这样做?
奥尔特曼:就像今天的语音界面一样,我认为它有点糟糕,因为效果不太好。
如果你能对电脑说:“这正是今天我想要完成的事,如果我被耽搁了或有任何变化,我相信你会在不打扰我的情况下,去做所有事。”
除非它是一个超级棒的人类助手,不然界面就会消失。希望我们能向人们展示一种不同的电脑使用方式。
AI for Science:Sam 的个人赌注
Tan:展望未来十到二十年的时间里,您个人最兴奋的是什么?现在人们应该构建什么来实现这样的未来?
奥尔特曼:这是一个难以想象的超级智能世界,我期待看到它的发展,而不是让它成为一个模糊的答案。我认为 AI 应用到科学是我个人最兴奋的。
我相信世界上所有长期可持续的经济增长,就像所有能改善人们生活的事情一样,基本上都在于发现新的科学,并拥有相当完善的治理机构,以便这些科学能够得到发展并与世界共享。
如果我们能够大幅度提升 AI 在科学探索中的速度,我相信能够为每个人带来提升和奇迹。
Open AI 发展:人才吸引与竞争力
Tan:你是世界上最擅长聚集最聪明的人之一吗?你在招聘方面学到的最艰难的教训是什么?
奥尔特曼:招聘真正聪明,有动力高效能团队合作的人,能让你成功 90%,而人们在招聘过程中对其他事情的关注程度总是让我感到惊讶。
招聘一个能够保持良好的业绩记录,好奇心强、积极融入工作并与公司愿景保持一致的人,效果会很好。
Tan:保持良好的业绩记录是指那种在顶级机构担任了二十年管理职位、拥有顶级声誉的人?
奥尔特曼:在创业初期,我不推荐招聘这样的人。坦白说 YC 创业初期招聘过这样富有管理经验的人,但效果并不理想。
我们还是选择招聘年轻有活力能完成任务的人,而不是那些有着极其辉煌履历的人。我会问,你做过印象最深刻的一次事情是什么。
Tan:担任 Open AI 的 CEO,总的来说,最难的教训是什么?
奥尔特曼:我们必须同时做很多事情,而且有很多大公司以各种方式向我们发起挑战。我们必须花费更多精力去处理这些问题,而且我们需要从一种重大决策方式切换到完全不相关但同样重要的决策方式去应对和处理。
Tan:对于很多想要创建 B2B、SAS 的软件工程师来说,如何在当下去完成一个复杂麻烦的事情?
奥尔特曼:现在是科技史上最佳的创业时机。成功之处在于,初创公司比其他大公司更容易迭代,且成本更低。大公司有很多优势,但它们的迭代速度非常慢。但是,便宜的东西也很容易被取代,所以有很多角度去看待这个问题。
我建议这样看待它们:每个人都会面临同样的挑战和机遇,但是当行业周期变化如此之大,初创公司几乎总是赢家,我们可能从未见过如此巨大的变化。
从这个方向出发采取行动,我认为你会处于非常有利的状态,或许你可以邀请我谈谈,比如随着时间的推移,你可以建立哪些防御性领域,我认为这是一个内在问题(内部问题)。
Tan:你会对学生时代的自己说些什么。
奥尔特曼:我希望有人能教我长期坚持信念和韧性,很多人在一次失败后就放弃了,学习如何坚持下去,我认为这真的很重要。
培养对自己直觉的信任,并随着时间推移不断完善你的决策和直觉,从而增强这种信任。好的部分真的比你想象的要好得多,而困难的部分,难以用任何你能理解的方式表达出来。你必须坚持下去。
One More Thing
结果好巧不巧,没过几天他就公开发起投票,o3-mini 水平的模型将在哪一年能在手机上运行?
截至完稿前,投票网友中,超过 40% 的人认为此模型 2025 年便可运行。
好好好,就在等着了(Doge)。
本文来自微信公众号:量子位(ID:QbitAI),原标题《ChatGPT 化身生活操作系统:奥特曼预告下一代顶级 AI》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。