教 AI 入侵 AI,科学家研发 Masterkey 新方式

2023-12-29 14:31IT之家 - 故渊

IT之家 12 月 29 日消息,新加坡南洋理工大学(NTU)的计算机科学专家近日研发了新的方法,可以使用聊天机器人来入侵聊天机器人。

该科研团队训练了一个 AI 聊天机器人,可以绕过其它 AI 聊天的安全限制。

团队研发了名为 Masterkey(LLM)的算法,逆向设计了 LLM 检测和防御恶意查询的方式,然后教会 LLM 自动学习并通过相关提示词,可以绕过其他 LLM 的安全性。

团队通过这种方式,可以创建一个黑客 LLM,它可以自动适应新条件,并在开发人员对其 LLM 进行更正后创建新的黑客请求。

研究团队成功利用这种方式入侵 AI 模型之后,已经通知服务提供商相关问题。

IT之家附上《新闻稿原文地址》,感兴趣的用户可以深入阅读。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享