万物皆可《毁灭战士》,专家利用 GPT-4V 模型运行该游戏

2024-03-13 10:19IT之家 - 故渊

IT之家 3 月 13 日消息,英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》,探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。

de Wynter 为此设计了一个系统,使用 GPT-4V(GPT4 的多模态衍生版本,可以接收图像作为输入)捕捉游戏引擎的画面截图,并返回游戏状态的结构化描述。

他设计了一个 Agent 模型,根据视觉输入信息,并对比此前历史记录作出决策,并将其反应转化为《毁灭战士》游戏可以理解的按键命令。

简单地说,系统会截取游戏截图,并利用这些截图找出游戏中发生的事情。然后,它利用系统的另一部分,即代理模型,来决定游戏的下一步行动。Agent 模型将其决策转化为游戏可以理解的命令,比如按哪个键。

根据测试结果,目前 GPT-4V 运行《毁灭战士》游戏存在几个问题:

  • GPT4 缺乏对象永久性,这意味着游戏中的敌人没有出现在屏幕画面中,它会忘记他们。

  • GPT4 在推理和清晰解释自己的行为方面也很吃力,经常提供错误信息。

尽管存在这些局限性,但 de Wynter 认为,GPT4 能够在没有事先训练的情况下玩 DOOM,这一点非常了不起。

IT之家附上论文参考

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享