丨科学探索

.hd-box .hd-fr

ChatGPT + Midjourney，一卷卫生纸拍出科幻大片，200 万网友围观

2023-04-03 12:20新智元(新智元)44评

AIGC 时代来临，整个内容创造领域在都被颠覆！新机遇面前，谁会被替代，谁又能弯道超车？

最近，AI 跑得实在太快！

国外大佬为一纸「AI 不扩散条约」吵得不可开交。国内这边，B站、爱奇艺等一众互联网企业也在成都视听大会上大讲特讲 AIGC。其中，陈睿也在现场介绍了B站的 AIGC 内容。

疯狂熬夜追热点的小编 be like👆

陈睿提到，随着 AIGC 时代的来临，我们每个人都身处科学技术加速变革的新时代：

年轻人们对于 AI 技术相关内容的需求急速增加，越来越多的 UP 主们也在制作各种 ChatGPt、AIGC 相关的内容。到目前为止，B站上 ChatGPT 相关的内容播放量已经达到了 2 亿。

陈睿预言，AIGC 时代的来临，并不只是一场科技领域的革新，而是对整个互联网行业，甚至对整个社会都有颠覆性的影响。

在 ChatGPT 等 AI 技术爆炸式增长的年代，陈睿的判断并非空穴来风。

前段时间凭借「一对坐在屋顶的 90 年代中国情侣」出圈的 AI 作画神器 Midjourney，更是不要太火。

一大波新用户涌入之后，直接挤爆了服务器，导致官方被迫叫停免费试用。

与此同时，各种神乎其技的 AI 绘画层出不穷 ——

有穿越到苏联工厂的马斯克，有看海棠的学妹，还有中国版的赫本等等。

来源：Cydiar

此处分享一个 prompt，可以尝试尝试：

A Chinese 20-year-old Woman, looking like Audrey Hepburn, Black hair, standing on 2023 Tokyo street, hyper realistic portrait photography, pale skin, dress, wide shot, natural lighting, kodak portra 800, 105 mm f1. 8，32k --ar 16:9 --v 5 --s 750 --q 2

而且，如此震撼的 V5 才刚推出没多久，更厉害的 V6、V7、V8 据说已经在路上了。

AI 颠覆视频创作

在成都视听大会上，陈睿提到，AIGC 的发展将极大地提高内容创作者的效率，就像 2000 年手机出现摄像头，让普通人也能随意拍摄一样，AIGC 的出现也能让很多普通人，也能创作出过去只有专业人士才能创作的内容。

前段时间，一个外国小哥，就尝试了完全由 AI 主导，创作一条视频。这条视频从脚本，到导演、编剧、摄影、配乐的活，AI 全包圆了。

而且这条视频，完全是用现在主流的 AI 工具做出来的，而这位小哥其实只是个 AI 的工具人（顺便出了个镜）。也就是说，我们现在就可以像他一样，完全操纵 AI 来创作视频了。

其中，脚本由 ChatGPT 编写，图像由 Midjourney 生成，然后使用 Runway Gen-1，把图像风格应用到源视频中，最后，再由 Boomy AI 配乐。

首先，对 ChatGPT 说：「给我写一个脚本，生成一个由三个 3 秒剪辑组成的 9 秒视频。这个故事是，一个男人在他的客厅里，要以科幻为主题。」

ChatGPT 生成了如下的脚本。

第二步，就可以根据脚本，在 Midjourney 中制作参考图像了。

prompt 是「imagine sci-fi film still, medium shot, centered, side-angle view, a man sitting on a chair, holding a glowing orb in his hands, living room, new york, 4k --ar 16:9」（想象一下科幻电影静止画面，中景，居中，侧角视角，一个男人坐在椅子上，手里拿着一个发光的球体，客厅，纽约，4k - -ar 16:9）。

在第三步，这位小哥重新布置了客厅里的一些家具，为了更好地匹配参考图像，来得到更清晰的输出。

然后，他用一部 iPhone，就拍摄出了原始镜头。

第四步，他把视频和参考图像上传到 Gen-1，它立马把视频变成了参考图像的风格。

这一步中，小哥没有使用文本提示，但添加了--interpolate 作为更平滑输出的参数。

第五步，就是把视频导入视频编辑器。

他用的是 iMovie。导入视频后，修剪了一些片段，然后把它们连在一起。

第六步，小哥从 Boomy 中，根据自己想要的风格和情绪，生成了配乐。

他在选择了一首叫做「Trippy Harvester by Peaky Chicky」的曲子，与场景的气氛非常相配。

最后一步，添加音乐并导出。

非常幸运的是，不需要进行太多剪辑，因为视频和音乐完美地吻合。

就这样，经过了 3 个小时后，一段梦幻大片诞生了！

AI 负责体力劳动，我来负责脑洞

无独有偶，国内的B站UP 主「Mega 会玩」，也通过几个 AI 工具，让乔布斯「复活」了。

在参观了乔布斯故居之后，Mega 忽然有了一个想法，希望生成一段自己采访乔布斯的视频。

乔布斯的「大脑」，当然就来自 ChatGPT。因为已经用 1750 亿参数训练过，它完全可以以对应人物的风格进行对话。

而乔布斯的声音，则是用一款 Tacotron 2 模型生成的。

Mega 把乔布斯生前的语音素材进行分段处理、标记，训练了几天后，最终生成了乔布斯的 AI 语音模型。

而接下来，便来到了最有趣的一步 —— 用 AI 克隆一个人。

如果 2023 年，乔帮主依旧活着，应该是一位年近七旬的老人。

Mega 使用 Midjourney，调整了各种参数和 prompt 之后，终于生成了一个理想的最终版本。

在下面这个视频中，我们看到了「复活」的乔布斯对于自己的重生这样描述道：

以这种方式回到世界会感觉有些奇妙，以 AI 这种方式重生虽然让我惊讶，但这不过是人类众多不可思议进步中的一个而已。

而在采访最后，Mega 问出了自己最想问的那个问题：你对于现在的苹果公司有什么感想吗？

「乔布斯」的回答可谓亮点满满：「我无法评价苹果当前的文化和践行，因为我已经不是他的一部分。但我真心希望，苹果可以一直铭记创新和突破现状的重要性。」

比高产更高产

除了可以凭空生出我们想要的内容外，AI 还肩负着一项重要的「使命」：搞定制作过程中繁琐的「脏活累活」。

关于知名 UP 主半佛仙人，一直有着这样一个未解之谜：他的视频里，为什么能有这么多好笑的表情包？

瓜众们对这个问题实在太好奇了，以至于这个知乎问题已经有了 43 万的浏览量……

而在这个问题下，半佛仙人本人也出现了，解答了瓜众们的疑问 —— 其实，这些素材就是用 Python 爬出来的……

另外半佛仙人表示，自己当然有团队，否则按这个产量，没有团队的话物理学都得被颠覆了。

那现在，有了 AI 工具，这些表情包甚至都不需要爬虫，可以自己量产了。

虽然目前，整合素材、寻找合适的音效和画面、加后期配音等过程都还需要人肉制作，但未来这些功能，很可能 AI 都能给我们包了。

比如最近，ChatGPT 联网后，可以接入各种第三方插件了。

其中一个「代码解释器」插件，可以直接让我们用 ChatGPT 编辑视频了。

只要给出一个指令，ChatGPT 就会对上传视频文件进行处理，稍等片刻之后，就可以直接下载了。没错，就是这么炸裂。

这么看来，未来在 AI 的加持下，人类创作者们可能真就只需要出个脑子，剩下那些不想做，或者麻烦的，都可以丢给 AI 去负责。

稳住不慌，弯道超车

看到这里，或许会有人惊呼，既然知识供给模式被完全颠覆了，那知识创造者的饭碗，岂不是也被砸了？

其实，还没到这一步。

让 AI 成为自己手中趁手的利器，远比忧心自己被 AI 淘汰了来得实际。

要知道，现在的许多人还没有提出需求的能力，也根本想不清楚自己「需要什么」。

比如，给你一个 AI 画图工具，你能用它画出什么？

它的上限，完全取决于你 prompt 能力的上限。

AI 的能力，已经给你放在这儿了，你能如何驾驭它，用它大力出奇迹，则完全取决于你的指挥能力。

比如现在，让你生成一幅港口的照片，你会怎样去对 Midjourney 和 Stable Diffusion 去描述？

一个真正的 prompt 大师，能写出「港口、船只、日落、美丽的光线、黄金时刻…… 超现实主义、聚焦的、细节丰富的…… 电影画质，杰作」这样的提示，让 AI 画出一幅完美的画作。

而最近小编印象深刻的一个例子是，在必应的 Image Creator 里，我想试试画出《荷马史诗》的场景。

然而要输入 prompt 时，却忽然词穷了。

小编灵机一动，那让 GPT-4 教教我？

把 GPT-4 给出的 prompt，放进 Image Creator 后，生成的画真是震撼我全家……

而去年在科罗拉多州博览会艺术比赛的获奖者、《太空歌剧院》的创作者，直接拒绝分享出自己在 Midjourney 所用的提示。

据说，他花了 80 多个小时，在 900 次迭代中，才完成了这幅画作。

这也就是为什么，外国的 prompt 工程师，年薪已经开到了 36 万美元。

从 AI 作画来说，一个优秀的提示工程师，必须拥有多学科的背景。经验丰富的工程师，和业余爱好者之中，存在着明显的门槛。

只有掌握了丰富的艺术史和平面设计等专业知识，才能写出「用 35 毫米胶片拍摄」「波斯…… 伊斯法罕的建筑」「法国画家 Henri de Toulouse-Lautrec 的风格」这样专业级别的 prompt，生成如下画作。

从这一点来说，人和人的差别，在 AI 面前将被无限放大。

很明显，你本身需要是一个知识广度和深度都足够的人，你有多渊博，AI 就有多出彩。

当信息可以被极度自由地获取，对信息的再加工也就随之变得更重要，在这一点上，我们每个人都是站在同一起跑线上的。

可以想见，在这种情况下，知识付费会是移动互联网催生出来的一大商机。

就在这几个月，我们亲眼见证了种种 AIGC 产品的光速迭代，成为「知识中介」这件事，也变得前所未有的简单。

随着 AIGC 技术的发展，做视频可能难度并不会比写文章高多少。内容创作者只需要出核心的创意，剩下的都可以交给 AI 来自动生成，视频制作的难度将会大幅度降低。

个人创作者的数量，可能也会迎来高速增长。

尤其利好的，可能就是B站知识类 UP 主这类创作者。毕竟剪视频的时间省了，找资料的时间也省了。只要有核心的创意点，做出优质视频就不是问题。

届时，优质创作者的内容创意潜力将被完全开发出来，视频将会成为绝对主流的内容。

对于创作者来说，这并不是某种遥不可及的预言，而是触手可及的近未来。

这也是为什么，B站上最近这几个月 ChatGPT 相关内容井喷，更是有很多 UP 主直接开始尝试用 AI 做视频。

也许不用多久，我们就能看到，越来越多独立创作者出现。他们不用再选择团队创作这种重工业模式，而是一两个主创 + AI 就可以轻装上阵，用比过往高十倍二十倍的效率创作，将那些本来没有能力做成视频的内容，畅快表达出来。

可以想象，随着 AIGC 的繁荣，知识类视频平台的发展，都会迎来一波水涨船高。

那么，在不久的将来，谁将被 AI 取代，而谁又会弯道超车？

本文来自微信公众号：新智元（ID：AI_era）

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

下载IT之家APP，分享赚金币换豪礼

人工智能 ChatGPT

吵翻天，ChatGPT 到底懂不懂语言？PNAS：先研究什么是「理解」吧

Noise ColorFit Icon 3 智能手表发布：搭载 1.91 英寸屏幕，支持 IP67 防尘防水

真正的创作者是谁？现有法律解决不了 AIGC 版权归属难题

大家都在买广告

热门评论

查看更多评论