研究人员写道,这类视频被称为deepfakes,制作这样的原创视频并不容易。人的头部具有几何复杂性和高度的动态性,并且头部的三维模型有“数千万个参数”。
更重要的是,这项研究表明,人类的视觉系统非常善于识别三维模型人脑中的“哪怕是很小的错误”。一些看起来很像人类但并不完全属于人类的东西,会引发一种“恐怖谷效应”(uncanny valley effect),并给人们带来深深的不安感。
人工智能此前已经证明,制作令人信服的deepfakes是可能的,但是需要从多个角度拍摄目标对象。在这项新研究中,工程师们将人工智能引入了一个非常大的数据集,里面有显示人脸活动的参考视频。科学家们建立了适用于任何一张脸的面部地标,来教授“神经网络”人脸运动的一般规律。
然后,他们训练AI使用参考表达式来映射源特征的移动。研究人员称,这使得人工智能即使只有一张图片可用,也能创建deepfakes。
科学家们写道:“更多的源图像在最终动画中提供了更详细的结果。在一项用户研究中,一段用三十二张图片而不是一张图片制作的视频达到了堪称完美的真实性。”
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。