首页智能时代人工智能

直播版 Deepfake 实现单张照片实时视频换脸，5 分钟安装不挑硬件

量子位
2024-08-10 12:48

马斯克“最新直播”，不好好扣他那 polo 衫扣子，拿个手机打光晃来晃去。看他脑袋左转右转，嘴角扬起的微笑，ak 都压不下去。

Why 啊？！

答案揭晓 —— 这活灵活现的马斯克，根本不是马斯克本马！

而是一个最新 AI 换脸项目生成的：

只需一张照片，就能换脸搞直播。

不得不说，这样的马斯克还挺吓人的，有点鬼片怪蜀黍内味了~

本地安装一下，就能达到实时无延迟，还支持实时预览。

也就是说，无论搞在线会议还是直播带货，可以用任何人的脸了。

一打开会议软件，30 个马斯克正在开视频会议；一打开直播间，100 个董宇辉在发大额优惠券。

这个项目，叫做 Deep-Live-Cam，无需专用硬件加速。

虽然 AI 换脸已经不是新鲜事，但因为“1 张照片就能偷走你的脸去直播”，效果贼好，还被开源 —— 项目一下就火了。

直奔 GitHub 热榜第一，24 小时狂揽 1600 + 星。

围观网友中，激动者有之：

笑不活了，以后我参加任何视频会议，再也不用本人出席了哈哈哈哈哈哈！

也有人连连感慨，连老人都能用 AI 直播挣钱的时代终于降临，这一天来得太快就像龙卷风：

想过这一天会来，但没想过它来得这么快！

实时换脸直播造假

你有看过马斯克穿着汗衫在出租屋的场景吗？

△“马斯克”一本正经盯着屏幕

这个项目一出，大家都开始疯玩了起来，目前 GitHub 已累计 5300 + 星。（注意看，简介里还特意注明未经审查）

比如这位网友带来 repo，对它给予了高度的评价。

它的工作几乎完美无瑕，而且完全是实时的。我只花了 5 分钟就完成了安装。

之所以安装这么快，在后面他也透露了自己计算配置，确实很顶了。

他换脸胡子拉碴的小扎扎克伯格，或许他老了之后就变成这样了吧。

随后摇身一变，变身成了帅气大叔乔治克鲁尼，但嬉皮笑脸版。

还有休格兰特。

相信细心的朋友也看出来了，为啥这三位的发型和胡子都一样。

这应该也是这款软件的一个小 bug：发型不能轻易改变，胡须也很难隐藏。

因此它无法解决一些秃头的需求 —— 没办法通过换脸长出头发……

也是注意到这个软件背后存在的风险，作者在项目最开始就特此声明。

首先，这款软件旨在为人工智能 media 行业做出贡献，去帮助一些博主啊什么的完成一些任务，比如制作自定义角色的动画、将角色用作服装模特等。

为了避免一些不道德的应用，它有个内置检查功能，可防止程序处理一些不适当的内容。

作者也坦言，未来项目也可能关闭或者在输出结果上添加水印。并建议大家如果使用的是真人面孔，建议征得当事人的同意，并在网上发布内容时明确说明这是 DeepFake 的。

随后作者分享了食用技巧。他首先表示，他在本地计算机（CPU）更有可能运行，但速度会非常慢。

简单四个步骤：首先进行一些配置：python (3.10 版本推荐）；pipgit；ffmpe；visual studio 2022 runtimes (windows)；克隆存储库，然后下载两个模型：GFPGANv1.4 和 inswapper_128_fp16.onnx，并将其放到 models 这个文件夹中。

最后再安装依赖项；如果想使用 GPU 加速，作者也进一步提供了操作指导。

安装完成之后就可以进行使用啦~ 不过首次运行时会下载一个大约 300M 的模型。

如图所示，选择一张脸的图像以及目标图像 or 视频，然后点击 Live。

这个项目的前身叫做 roop-cam，拍摄一段视频，用你选择的人脸替换其中的人脸。

您只需要准备一张所需人脸，比如寡姐的图像。整个过程无需数据集，无需训练。

同样也支持 Live 模式。

几乎无法区分的照片级真实感

随着开源时间渐长，开发者和围观网友们的讨论也日益增多。

不少人认为这很“crazy”，因为操作门槛这么低、效果这么好的项目，它居然开源了。

另一群认为这很“crazy”的人，则是忧心忡忡，觉得这个世界更加真假难辨了。

后者担心的问题，显然摆在我们每一个人眼前。

AI 换脸 —— 无论是直播、视频会议还是图片、语音，都是现在网络冲浪的各位，需要瞪大眼睛仔细辨别的。

就拿近期 AI 绘画届，最新顶流 FLUX 来说吧！

这是 Stable Diffusion 原班人马官宣创业的第一个项目，连 AI 大神卡帕西都激情转发表达对其效果的赞赏。

不管是手还是文字，效果都很真实，很震撼。

△FLUX 生成的“照片”

于是有推友，用 FLUX、可灵等 AI 生成工具，做了一个 100% AI 的油管主播。

网友看了直流泪，“AI 为什么生成得这么逼真，难道我们是不知道真人长啥样嘛。”

难怪有人感慨，这难道就是传说中的“硅谷遇上恐怖谷”？

以后的互联网，一定是超奇怪的地方…… 虽然现在就已经很奇怪了啊啊啊啊啊呜呜呜呜呜。

对此，量子位只能说 ——

那如果，再加上这个口型同步模型 ReSyncer 呢？（对，这有一个狗头）

ReSyncer 放出了自己和 Heygen 在唇形同步效果上的对比：霉霉再现说中文神技。

观感是什么？

大概或多或少都和这位推友有共鸣：

AI 技术让真・后真相时代到来了。

说到这儿就不得不放个近期的新闻：

3 天前（8 月 7 日），湖北黄石市公安局下陆分局对外公布，破获了一起用 AI 换脸技术解冻社交账号并倒卖获利的案件。

三名男子把一些视频进行 AI 换脸，然后用换脸后的动态面部，来解冻一些已被平台冻结了的账号。

最终，他们仨利用 AI 换脸，解锁了 2000 余个社交账号，非法获利超 40 万元。

谁说 AI 带来的诈骗风险，只来自于直接换脸呢？

但 AI 生成、AI 换脸走向几乎无法区分的照片级真实感，已经是大势所趋。

怎么办？！

已经有人坐不住了，在讨论区表示，正在针对渲染时的编解码器，开发一个深度伪造检测插件。

让我们为 ta 加油吧……

参考链接：

[1]https://github.com/trending
[2]https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/
[3]https://x.com/levelsio/status/1822067118914879808

本文来自微信公众号：微信公众号（ID：QbitAI），作者：关注前沿科技

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

有价值还可以无价值

相关文章

人工智能 deepfake

AI 当奥赛裁判？3D 运动员追踪技术到底是啥

北京航空航天大学发布“小航”AI 助手：200 PFlops 算力、12PB 存储能力

英国 CMA 启动对亚马逊与 AI 创企 Anthropic 合作关系第一阶段调查

查看更多

全部评论

软媒旗下人气应用

最会买

IT之家

要知

说两句...

打开APP