英伟达公布 Neuralangelo AI 模型，可将视频内容转换为高精 3D 模型

2023-06-02 18:47IT之家 - 漾仔（实习）

感谢IT之家网友 Sancu 的线索投递！

IT之家 6 月 2 日消息，英伟达公司于本周宣布推出一款名为 Neuralangelo 的 AI 模型，该模型能够将视频片段转化为细节层次丰富、具备贴图的 3D 模型。

▲ 图源英伟达

IT之家查询得知，此前也已经有数个基于视频内容生成 3D 模型的 AI，但这些 AI 往往在面对低对比度视频时便无法着手。而英伟达的 Neuralangelo 模型采用了即时神经绘图（instant neural graphics primitives），并利用了自家的 Instant NeRF 技术，因此即使是对于低对比度的视频，也可以从中捕捉到微妙的细节，并转换为更具备商业价值的 3D 模型。

▲ 图源英伟达

英伟达强调，Neuralangelo 的独到之处主要表现在其“准确性”与“普适性”：

“准确性”即该模型可以准确呈现复杂材料的质地，例如屋顶瓦片、玻璃窗格和光滑的大理石；
“普适性”即创作者们能够简单使用智能手机拍摄的影片素材，即可创作出逼真的物件，并将其整合到他们的项目中。

▲ 图源英伟达

Neuralangelo 模型利用从不同角度拍摄的物品的视频作为输入素材，来生成创作者们所需要的模型。一旦 Neuralangelo 确定了视频中相机的运动规律，它就会生成模型的 3D 轮廓，并开始在上面雕刻出细节。

▲ 图源英伟达

预计英伟达将在 6 月 18 日至 22 日举行的电脑视觉与样式辨识（Computer Vision and Pattern Recognition，CVPR）大会上发布 Neuralangelo 模型。在内部演示中，英伟达展示了 Neuralangelo 模型重建的米开朗基罗著名雕刻作品《大卫》、英伟达位于湾区的办公室、及平板拖车等日常见到的物品的 3D 还原模型。

▲ 图源英伟达

除了 Neuralangelo，英伟达还将在大会上展示一款名为 DiffCollage 的模型。DiffCollage 是一种能够通过文字提示词生成视频的 AI 模型，可以生成 360 度全景图像与循环动态图像，并再将这些图像扩展为具体的视频。

英伟达研究部高级主任、论文作者 Ming-Yu Liu 对这项研究的意义给出了畅想：

Neuralangelo 提供的 3D 重建能力将给创作者带来巨大好处，帮助他们在数字世界中重建真实世界。这个工具最终将使开发人员能够将精细的物体 —— 不论是小型雕像，还是大型建筑 —— 导入视频游戏或工业数字孪生的虚拟环境中。

IT之家的小伙伴们可以在这里找到论文的具体内容。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。