AI 被自己骗了,生成照片轻松逃过 AI 鉴别器法眼,马斯克机器女友、3 米巨人都「成真」了

以假乱真的 AI 生成式图片,AI 自己分辨不出来了。

这张马斯克和机器人女友的照片,5 个鉴别器里有 2 个都觉得是真的

还有这张人类和 3 米巨人的合照,居然 5 个鉴别器一致判断为真

啊这,AI 鉴别器似乎不太靠谱的亚子。

这就是《纽约时报》最近做的一项测试,他们找来了市面上五个常见的 AI 鉴别器,分别喂给它们 100 多张照片做测试。

结果发现,AI 鉴别器不仅会把 AI 照片错认成真的,也会把真实照片划定为 AI 生成的。

而且不同鉴别器之间的水平差距也不小。

具体表现如何?一起来看

加点颗粒(Grain)就能骗过鉴别器

在这项测试中一共使用了 5 个 AI 鉴别器,分别是:

  • Umm-maybe

  • Illuminarty

  • A.I or Not

  • Hive

  • Sensity

测试的内容包括 AI 和人类创作的图片,分别喂给每个鉴别器,看它们会怎样判断。

使用的 AI 创作工具包括 Midjourney、Stable Diffusion、Dall-e 等。

《纽约时报》主要展示了这样几个例子。包含 5 张 AI 创作的图片,以及 2 张真人拍的照片。

从统计结果来看,五个鉴别器中只有 Hive 全部判断正确。

Umm-maybe 的表现最差,只判断对了两张图。

举例来看,这张照片是 AI 生成的,听说还在 2 月的一场摄影比赛中拿下大奖,这道题就难倒了大部分鉴别器。

但这张纯 AI 生成的照片,就没有逃过大部分鉴别器的法眼。

对于人类创作的照片,AI 鉴别器的正确率比较高,两张照片都只有 Umm-maybe 鉴别器判断错误。

此外他们还专门测试了艺术画,发现大部分 AI 鉴别器能判断出这是真人画的。

对比另一幅 AI 创作的,同样也是四个鉴别器判断正确。

(Umm-maybe 啊…… 是真的不太行)

值得一提的是,如果对 AI 图像进行一些加工处理,AI 鉴别器会失效。

比如这张 Nike 男的照片,一开始有 4 个鉴别器判断它是 AI 生成的。

但如果给图片加一些颗粒,AI 鉴别器就会将这张图片的 AI 含量从 99%,判断为仅有 3.3%

最后,我们也测试了一些能上手实测的鉴别器(Umm-maybe、Illuminarty、A.I or Not)。

结果显示,对于“马斯克在苏联”这张图,Umm-maybe 觉得它有 85% 的概率是人类创作的。

Illuminarty 觉得它是 AI 创作的概率仅有 5.4%。

只有 A.I or Not 确定了它是 AI 生成的。

AI 鉴别的判断标准是啥?

那么 AI 到底是怎么鉴别真伪的?

普遍来说,它们和人类的判断标准不太一样,人类一般以图像内容的合理性为依据,而 AI 更多是从图像的参数入手,比如像素的排列方式、清晰度、对比度等。

所以这就解释了开头那张巨人照片,为啥所有鉴别器都觉得很真。

在 AI 画画大火一年多以后,如今市面上已经出现了非常多鉴别器。

有的就是直接放在 Hugging Face 上供大家免费使用,有的则是已经成立公司,只提供 API 接口形式。

比如 Hive 就是一家提供商业解决方案的公司,从如上的测试结果可以看到,Hive 的表现效果也是最好的,几乎都能判断正确。

而在这之前他们的主要业务是为平台网站提供数据审核服务,图像视频文字都支持,服务的平台有 Reddit、Quora 等。

参考链接:

  • https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html

本文来自微信公众号:量子位 (ID:QbitAI),作者:明敏

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享