本文来自微信公众号:SF 中文 (ID:kexuejiaodian),作者:SF
随着 ChatGPT 的火爆,人工智能好像突然走进了我们的现实生活,迅速在各个领域展现出极大的统治力。有了人工智能,从写作到设计,从驾驶汽车到调节室内温度,很多工作,人类似乎都不必“亲力亲为”了。很多人都觉得,人工智能的时代即将到来。但在绘画这件小事儿上,人工智能却总是栽跟头,特别是在绘制人手的时候。
文 | 亚历克斯・休斯(Alex Hughes)
编辑 | 赵佳明
你可能会以为,画人手并不需要多么高深的技巧。但无论研究人员怎样提升 AI 图像生成工具的性能,AI 画出的人手总有问题。
比如这张由编辑的小伙伴友情提供的图片,是由 AI 绘图平台 Midjourney 生成的。乍看之下,挺逼真的,好像真的是在一场狂欢派对上抓拍的似的。可仔细一看就露馅儿了!在这张图片中,很多人物的手都很奇怪,就比如图右边那位女士。
无独有偶,AI 图像生成工具“画出”的人手简直异曲同工:在这些图片中,有的人有 3 只手,有的人胳膊比长臂猿还长,手掌上还长了 7 根手指……
对此,英国伦敦大学学院的计算机科学家彼得・本特利(Peter Bentley)的解释是,这些 AI 绘图工具都是基于二维模型,而对于真实世界的三维样貌,它们完全没有认知。
人手看似简单,画起来没什么高深的技法。但人类灵巧的双手可以说是最复杂的“机器”,专业的画家要想画好人手的每个细节尚且不易。对于不了解人手真实三维结构的 AI 来说,这简直是不可能的。(图片来源:Pixabay)
如果你试着让 AI 生成一张简单的手部图像,那可能没什么问题。但如果你想要的是一张带有人手的复杂图像,而且特意给出了详细的绘图要求,那人工智能可能就会一头雾水了。最后生成的图像可能就犹如抽象派画作一般,令人难以琢磨。
但是,随着 ChatGPT 燃爆网络,AI 绘图也引来了一篇美誉之声:很多人认为,AI 绘图又快又好。但现实是,这些图片中藏着“致命”纰漏。
“这些由 AI 生成的图片真的经不住仔细观察,人们总能发现一些违反常理的地方。”本特利解释道,“这是因为,在训练过程中,研究人员更着重用大量的真实图片训练 AI,却没有告诉它们,这些图片之间的真实逻辑关系。那对于 AI 图片生成模型来说,它能做的就只能是把它认为最好的图片组合呈现出来了。”
这是一张由 Midjourney 生成的图片,看上去很精美是不是,但如果你仔细看看,就能发现画中隐藏的“硬伤”。你发现了吗?可以留言告诉我们。
其实,人工智能图像生成模型正在逐渐完善,但距离生成真正让人满意的图像还有很长的路要走。那么,到底该如何提升人工智能图像生成模型的性能? 人工智能绘图技术的未来又将如何?
本特利给了我们一些信心,他说:“通过三维模型训练,研发人员正逐渐让图像生成模型理解图像的真实构造和逻辑关系。在未来,即便我们给出很复杂的图像描述指令,最终生成的图像仍会清晰准确。”
不过,获取足够的三维图像数据需要大量时 间。众所周知,互联网上的大部分图像都是二 维的平面图像。现在,研发人员为人工智能绘图平台提供的也大多是这些缺乏细节信息的图像。”
好在,开发 ChatGPT 的美国 Open AI 公司已经开始尝试使用 Point-E 技术来解决这一问题。利用 Point-E 技术,输入文本提示就能生成三维模型。目前,这一技术已经对公众开放,但还不能高兴得太早,从目前的测试结果来看,Point-E 技术还需进一步完善。
一旦 Point-E 技术更加完善,不用说生成三维图像,就算一个崭新的数字化世界可能会就此建立。尽管 AI 绘图还有很多离谱的纰漏,但我们相信,人工智能绘图技术会持续进步,未来生成逼真的三维图像甚至完全数字化的世界也许不再是梦。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。