AI 渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定
- 量子位
2023-01-04 14:55
小美、小帅、丧彪和佛波勒,这几位 AI 配音的主角,已经成为某音某手用户心里比“李华”还要亲的朋友们了。
然鹅,配音显然已经满足不了 AIGC“大放异彩”之心,它对短视频赛道的入侵再加一:
生成式 AI,开始拍视频!
还是带画外音的那种。
这个技术来自一个名为 QuickVid 的新网站,它把好几个生成式 AI 组合成了一个工具。
创建的短视频适配 YouTube、 Instagram、 TikTok 和 Snapchat 等。、
哇哦,Unbelievable~
QuickVid,明星 AI 产品杂烩
QuickVid,是个刚出生 7 天(去年 12 月 27 日推出)的小 baby 网站。
年纪虽小,但不妨碍它一展身手。让我们看看这个网站要怎么玩儿:
首先,用户需要输入一个提示词或一小句提示语,用来描述想要创建的视频的主题。
比如本文开头的视频,就由短短的两个提示单词“Machine Learning”生成。
这个功能,依托的是 GPT-3 的文本生成能力。
接着,根据这些提示,QuickVid 会从免版税的媒体储备库 Pexels 中选择一个背景视频,并使用 DALL-E2 生成覆盖图像。
然后,QuickVid 会通过 Google Cloud 的文本到语音 API 输出画外音。
这一步可以选择克隆用户自己的声音。
因为创始人了解到,好多创作者对自己制作的 AI 配音视频提不起多高的兴趣,毕竟视频配音没有用自己的声音。
最后一步非常简单,就是把上述元素合并。
当当当当!一个 AI 生成的短视频就诞生了。
GPT-3、DALLE-2…… 总而言之,QuickVid 像是一道现有 AI 产品的明星杂烩。
并且,利用重复的、模版化的 B-roll 短视频格式,还避免了必须自己生成视频这一关。
值得关注的一点是,因为允许 Copilot 在 GitHub 的公共仓库上“偷代码”,微软、GitHub 和 OpenAI 正因被指控违反版权法而接受集体诉讼。
这个案子对 DALL-E2 这类的 AI 产品有着深远的影响,因为人们发现 AI 可以从训练集中“抄袭”。
不过 QuickVid 并不太担心,他的创始人 Daniel Habib 大胆放话:
如果明天出现一起让 OpenAI 消失的诉讼,我们也不怕。
因为我们有好几种替代方案可以为 QuickVid 提供 AI 生产力呢~
这里提到的替代方案,是类似于 DALL-E2 的开源系统 Stable Disusion,QuickVid 已经在用它测试生成头像图片了。
Habib 曾是 Meta 的员工,负责 Facebook Live 和视频基础设施的开发,他用几周的时间搞出了 QuickVid。
根据一些媒体的实测,QuickVid 生成的视频质量好坏参半。
生成的背景视频内容往往十分随机,有的和提示词只能有拐十八道弯的一丢丢联系。
不过也不算稀奇,因为 QuickVids 目前背靠的仅限于 Pexels,而且 DALL-E2 生成的图像本身也有文本混乱和比例失调的局限性。
官方针对这一点给出的回应是,“我们每天都在修补 bug 哟”!
现在的 QuickVid 功能还比较简单,但已经足以凑出一个带有信息量的 YouTube 或 TikTok 短视频了。
这个月,QuickVid 会维护更新一些个性化功能。
摆在 QuickVid 们面前的几道坎
Habib 在回复 TechCrunch 电子邮件时,将 QuickVid 称为为创作者提供快捷制作高质量内容的工具。
“(目的是)帮助创作者增加内容输出,减少过度劳累的风险。”
创作者生产短视频时的工作量是减少了,但用户和审查者的工作量蹭得往上涨。
大量内容的一键生成,让目前质量还不高的视频内容,连字带影像,有瞬间挤满整个视频网站的能力。
没错,像 QuickVid 这样的工具,可能会让已经拥挤的短视频网站和 App 充斥着没啥营养的信息,以及重复内容。
回答相关问题时,Habib 把相关责任归在平台身上。
他认为,是视频平台的算法而不是 QuickVid 来决定这些视频会不会被推荐、是否会被放在首屏。
“如果人们不想看你的视频,那么你在 YouTube 这类平台发了视频也传播不开。”他补充道,“不管你是不是使用 QuickVid 生成的视频,但凡内容质量太低,人们就会抛弃你的频道。”
当然,站在 QuickVid 面前的难题显然不止这一个,它面临诸多问题考验。
比如有创作者的潜在抵制。
不管是因为成本问题(QuickVid 的包月费用是 10 美元 / 月),还是因为会面临与 AIGC 抢饭碗的窘境,对自己内容质量更为看重的创作者们,有的会选择不使用这类工具。
再比如版权问题。
根据 Habib 的说法,QuickVid 用户们可以将自己生成的视频商用,但是 AIGC 的版权问题本就处于暧昧不明的阶段。
就前几天的事儿,美国专利和商标局(USPTO)撤销了对 AI 漫画的版权保护,称要获得版权保护需要人工授权。
不过,Habib 觉得 USPTO 的这一行为跟 QuickVid 没啥直接关系,因为那只涉及 AI 产品的“可专利性”,而不涉及创造者使用和商业化其内容的权利。
创作者关心的是放出高质量的内容,帮助频道涨粉。
除了法律问题,摆在 QuickVid 面前的还有内容审查这个大工程。
虽然 OpenAI 已经利用过滤器来防止偏激内容和歪曲事实的内容生成,但 bug 依旧存在。
GPT-3 时不时仍会提供错误信息,尤其是近期发生事件,因为近段时间的信息还没进入它的知识库。
这对 ChatGPT 来说也一样,而且后者已经被证明会被“套出”性别歧视和种族主义相关内容。
当 Techcrunch 进行测试时,QuickVId 在“批判性种族理论教育学生”这个提示下,生成了一个视频,其内容暗含观点,认为批判性种族理论可以用来给学生洗脑。
对此,QuickVid 主要依赖的还是 OpenAI 的过滤器来避免错事儿发生。
同时还动员每一个使用 QuickVid 的用户,宣称大伙儿有义务手动审查每一个由 QuickVid 创建的视频,以确保“一切都在法律的范围之内。”
One More Thing
不过有个值得令 QuickVid 们小兴奋的消息,那就是谷歌并没有区别对待人写文本和 AI 文本。
不过谷歌还是对那些“旨在操纵搜索排名而不是帮助用户”的内容采取裁制,因为这些内容“没有足够的价值”。
这就让 QuickVid 们需要小心了,因为纯自动化流程生成的内容,很容易就被归到“没啥价值”那一类。
不过说到底,如 Habib 所说的那样,生成式 AI 革命是不可阻挡的。
如果 AI 生成短视频开始大规模流行,各类平台不会也不敢拿它怎么样 —— 至少不会全面禁止它。
你会因为有了这样便利的工具,成为短视频平台的创作者吗?
也许今晚打开短视频 App 刷到的第一个推荐就是你的(手动狗头)。
直达链接:https://www.quickvid.ai/
(由于涌入人数过多,现在注册需要排队了,我恨)
本文来自微信公众号:量子位 (ID:QbitAI),作者:衡宇
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。