清华首个虚拟学生华智冰露脸唱歌,小冰公司:实现完全虚拟生成不存在的面部

2021-09-30 08:25IT之家 - 远洋

IT之家 9 月 30 日消息 近日清华虚拟学生华智冰弹唱歌曲的视频走红网络,这也是团队首次发布其正面露脸视频。华智冰是由清华大学计算机系、北京智源研究院、智谱 AI 和小冰公司联合培养,是中国首个原创虚拟学生,已在清华园里开启学习和研究生涯

小冰公司对此发表了声明,声明中小冰解释了华智冰项目的初衷:希望能够以智能模型作为核心,试验预训练模型能够带来哪些技术与应用方面的惊喜。

小冰公司在声明中还称,新的产品化技术实现了完全虚拟生成不存在的面部,且具有足够丰富的 features,从而能够实现精度更高的视觉化交互内容。视频中人物的面部特征,包括人脸、表情、口型等,全部由人工智能小冰框架 X Avatar 生成并进行融合;视频中的人物肢体、动作,包括手持吉他弹唱,来源于小冰团队成员鱼子酱酱录制的原始视频模版。视频中的歌声,由人工智能小冰框架 X Studio 生成。

据悉,华智冰将师从清华大学唐杰教授,即日起开启在清华大学的学习和研究生涯。

IT之家了解到,华智冰是由清华大学计算机系、北京智源研究院、智谱 AI 和小冰公司联合培养,可以作诗作曲,生成图画,还将具有一定的推理和情感交互的能力,而她来到清华的第一年将通读“天下书”,不断地为其输入各种语料;第二年进入“精读”阶段,引导华智冰对语料背后的逻辑有更深刻的理解;第三年则培养她的创造力,从此有望在多项认知智能上超过人类。华智冰智商和情商双高,可以作诗、作画、创作剧本杀,还具有一定的推理和情感交互的能力。不同于一般的虚拟人物,华智冰背后依托的是中国“悟道”超大规模人工智能模型。

以下为小冰公司的具体声明:

随着视觉化交互内容(如短视频)的不断深化,对于人物出镜交互的需求越来越多。但是,由于人类的行为存在各种不稳定性,常常给商业机构和品牌方带去很大的风险与不确定性。对此,越来越多的商业机构、内容制作方与品牌方,呼唤一种安全可控的虚拟人类内容(含商业代言)产品化技术。

但是,已往付诸产品化的技术存在诸多问题:它无法像真实人类一样,生成足够丰富的面部 features,且无法打通生成与替换的端到端流程。因此,只能实现真实人类面部间的替换,精度质量不足。

更严重的问题是,以往的方法无法从根源上避免隐私侵权风险。

新的产品化技术实现了完全虚拟生成不存在的面部,且具有足够丰富的 features,从而能够实现精度更高的视觉化交互内容。尤其是,由于从根源上避免了使用任何真实人类面部的可能性,有效阻断以往技术无法避免的隐私侵权问题。从隐私角度,是一个重要的进步。

我们相信,虚拟人将成为未来视频内容的主要提供者之一,而安全、可控、无隐私风险和侵权风险是其前提。因此,小冰一直在这一趋势方向上进行探索,并从不同方面对这一领域做拓展研究。小冰与清华大学计算机系合作华智冰项目,正是在预训练模型方面进行合作,希望能够以智能模型作为核心,试验预训练模型能够带来哪些技术与应用方面的惊喜。

这次传播的视频,来自小冰发布会的进展汇报展示,为华智冰能力续写了一些新的进展,demo 小冰框架下最新的面部生成和 3D 视频封装技术成果。具体来说:视频中人物的面部特征,包括人脸、表情、口型等,全部由人工智能小冰框架 X Avatar 生成并进行融合;视频中的人物肢体、动作,包括手持吉他弹唱,来源于小冰团队成员鱼子酱酱录制的原始视频模版。视频中的歌声,由人工智能小冰框架 X Studio 生成。

除此之外,华智冰除了 3D 面部生成,以及歌声合成的优化,还有其他很多更底层的、涉及数字人“大脑”的新技术应用,例如在有机融合了知识图谱和预训练模型后,可以让数字人有常识和推理能力。华智冰正在不断“成长”中,还会有更多最新技术的应用,敬请期待。

小冰公司

2021 年 9 月 29 日

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享