表情最逼真机器人靠 AIGC 再进化,接入 Stable Diffusion 学会用笔画画
- 量子位
2023-07-03 12:54
把 Stable Diffusion 接入机器人会怎样?
告诉它你想让它画什么,然后一笔一笔画出来。
只见它一边与旁边的人类工程师谈笑风生,一边熟练地用马克笔在白板上画出一只简笔的猫。
最后还不忘签下自己的名字“Ameca”,然后抬起执笔的手,用眼神继续审视着刚刚完成的作品。
当 Ameca 询问人类对它的作品是否满意的时候,工程师老哥耿直地回答“这画的有点简略了”。
然后高能来了。
Ameca 生气地呛了回去:
如果你不喜欢我的画,你可能只是不懂艺术。
机器人 Ameca,来自英国公司 Engineered Arts,之前就以表情逼真到吓人出名过一次。
现在它 get 到用笔画画的新能力,又惊艳了一众网友。
每一笔画完后轻轻举起笔,就像一个真正的素描艺术家一样,这个小细节太酷了。
机器人怎么用笔画画的?
Ameca 具体是怎么学会画画的,它自己就能解释明白:
我使用开源的 Stable Diffusion,对生成的图像做骨架化和向量化,然后再把转化出的轨迹转换成动作并执行。
就这样,Ameca 的身体动作和面部表情由 Engineered Arts 自研技术驱动,语言能力来自 GPT-3(没错,不是 3.5),再加上 Stable Diffusion,组成了一位机器人画家。
有网友表示,这样的能力在教育中很有用,对于学生来说,用机器人比盯着电脑屏幕看有意思多了。
Engineered Arts 自研技术包括机器人操作系统 Tritium 和机器人生产平台 Mesmer。
首先用 36 台摄像机无死角捕捉海量真人面部数据,包括骨骼结构,皮肤纹理和表情等。
对这些数据做 3D 建模,并 3D 打印出机器人的硅胶皮肤。
Tritium 操作系统连接了硬件、软件和云端,可以驱动机器人的每一个组件,除了面部,还会牵动头颈、肢体的不同“肌肉”。
最终实现更逼真的表情。
再加上语言模型 GPT-3 和语音技术,Ameca 已经初步具备了与人类互动的能力。
这次除了画画以外,Engineered Arts 还公布了另一条人类与 Ameca 讨论音乐的视频,或许暗示这是下一个挑战方向。
Ameca 说自己喜欢爵士古典和电子乐,人类给他出的难题“如果要把这三种风格融合在一起写一首歌,第一句歌词是什么。”
Ameca 略加思索就给出了回答。
另外 Ameca 还在搞一场与网友互动的活动。
如果你有什么问题想问它,可以去原视频评论区留言,下一条视频可能就是 Ameca 回答你的问题了。
参考链接:
[1]https://www.youtube.com/watch?v=_1OA_9_wW70
[2]https://www.youtube.com/watch?v=L32BRcvnWRU
[3]https://www.engineeredarts.co.uk/mesmer-creation/
本文来自微信公众号:量子位 (ID:QbitAI),作者:梦晨
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。