Q 版西部世界!生成式智能体来袭,我们是人格独立的 NPC!
游戏里的 NPC 都见过吧?
不管 NPC 是干嘛的,有任务的接任务,没任务的尬聊,他们共同的特点就是 —— 翻来覆去就是那几句话。
原因也很简单,这些 NPC 还不够智能。
换句话说,传统的 NPC 都是先给他们安排好剧本,安排好话术,该到哪步就说哪句话。
而随着 ChatGPT 的出现,这些游戏角色的对话可以在只输入关键信息的前提下,自我生成。
这就是斯坦福和谷歌的研究者们在做的事 —— 用人工智能创造出的生成式智能体。
这玩意儿的机理其实很简单,用一张图就可以简单进行概括。
最左边的 Perceive 就像是最开始的输入,智能体开始接收各类信息。
而中间的大框框,就是最主要的部分了,这里揭示了生成式智能体是怎么「生成」内容的,并且自发地走到最后一步「Act」。
生成式智能体最主要的特点就是有个 Memory Stream,也就是内存流。
就像上面提到的传统 npc,他们的行为和言语都是规定好的,没有自由发挥的空间。
而如果想自由发挥,就必须有自己的「库」,这个「库」里有 AI 记下的日常所见、所听的事物,并加以思考,这样才能进一步「Act」。
AI 必须得学习嘛。
而提取记忆、计划、反思的环节,就是 AI 处理记忆的环节。AI 不光能记住每天发生了什么,还能反思这些事件,制定每一天的计划。
同时,由 AI 的行为所引起的新反馈,他们也会记住,并当成新的素材,继续展开新一轮的处理。
Observation 就是每个角色对周遭环境以及人、事的观察,Reflection 则是对这些观察到的现象的思考。
然后角色们再根据这些内容生成 Plan。
一开始,他们先自己制定出大致的计划,然后慢慢细化。先是制定小时计划,再制定出 5-15 分钟的短期计划。
并且,角色还会根据周遭环境的变化修改各自的计划。完全模仿人类行为,谁不是一天到头疯狂修改自己的计划的呢。
这样,我们就看到了生成式智能体的魅力。
我们可以看到,完全体的生成式智能体(包含观察、思考、计划三部分)的表现要比缺少任何一种、两种的架构表现好得多。
在谷歌和斯坦福研究人员设计的场景下,一共有 25 个小 AI 人,生活在这么一张地图中。
研究人员一共设置了 25 个角色,并且给每个角色都设定了姓名和职业等基本信息。
比方说,John Lin 是一个药店店员,十分乐于助人。他总是在思考如何让他的客户更方便地拿药。
生活方面,John 和他的妻子 Mei Lin 一起生活,后者是一个大学教授。他们的儿子 Eddy Lin 正在学习音乐理论。
同时还建立了角色之间初始的关系网,比如 John 和他邻居的关系,对邻居的看法,以及和药店同事之间的关系,平时爱聊什么等等。
每一个角色都有这么一段预设的文字,初步勾勒出了角色框架,引发后续的交互。
而剩下的部分,就靠 AI 自己发挥了。
每个角色的行为都会由 emoji 表示,并且会在系统中用一句话概括。比如某某正在写日记,就会用
来表示。
有一天,Isabella 和 Tom 相遇。他们聊起了有关竞选的话题。
要知道,角色之间能使用完整清晰的自然语言进行交流。并且每个角色都能感知到附近的其他角色,并能根据各自的性格和人物关系来自行决定,是擦肩而过还是开始攀谈。
Isabella:「我还在想我该选谁。但我和 Sam Moore 聊过竞选的事。你对他是什么看法?」
Tom:「讲实话,我不是很喜欢 Sam。我觉得他有点脱离咱们的社区,不会为咱们的利益最大化而考虑。」
而出于试验的目的,研究人员还可以进行干预。不过这种干预不同于传统的输入剧本。而是在一些分支的走向上稍微施加一点力量,余下的部分还是靠 AI 自己发挥。
而具体到每一天的日常,每一个角色都会有自己的「routine」,这个「routine」是预设的。
以下就是药房小哥 John Lin 的一天。而至于每天会发生什么新鲜事,就是最有意思的部分了。
最后,再让我们看看情人节这天 AI 之间发生了什么有趣的互动吧。
在情人节这天,研究人员给了两个角色 Isabella 和 Maria 一人一条预设信息,告诉 Isabella 她要举办一场派对,并告诉 Maria 她喜欢 Klaus。
然后,两个角色就开始自己玩自己的了。
Isabella 在地图中溜达,看见人就邀请他们来自己的派对。
这其中就包括 Maria。Maria 肯定也不会错过这个机会和 Klaus 相处,于是她找到 Klaus,邀请他一同前往 Isabella 的派对。
Isabella 邀请完人也没闲着,去咖啡厅装饰了场地,还请来了 Maria 帮忙。
上面这张图展现了这些 AI 相互之间的关系,以及由派对引发的交互。
然后一群人 AI 就快快乐乐地在下午五点开始派对了。
下面这张图则是详细地展开了这场派对的举办是怎么由 AI 自发引导的。涉及到了记忆的提取、从对环境的观察中进行的反思,以及决策。
左侧是 Isabella 观察到的环境内容,比如闲置的冰箱、床、架子、书桌、衣柜等等,然后根据环境和要举办派对的意图,做出了装饰、邀请、设计派对等等决策。
如此一来,整个过程就显得非常饱满了。
以上的场景看似简单好玩,但是越发展越能展现出不一样的力量。
Pete 在推特上表示,这个成果未来可以应用在很多方面。
比如说应用在 VR 世界,有了这种生成式智能体充当 npc,想必像西部世界里设想的场景不再会是遥不可及的。
「在西部世界中,每一个 NPC 都有自己的思想,性格,计划,以及人际关系。甚至,更多的东西都是自主生成的。」
而由谷歌和斯坦福的研究者们做的这个玩意儿,就是个迷你的 Q 版西部世界。
参考资料:
https://twitter.com/nonmayorpete/status/1645355225157615616
https://www.reddit.com/r/MachineLearning/comments/12hluz1/r_generative_agents_interactive_simulacra_of/
本文来自微信公众号:新智元 (ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。