力压 DALL-E 3 等顶级模型,谷歌开放 Imagen 3 文生图 AI 访问
IT之家 8 月 16 日消息,科技媒体 VentureBeat 报道,谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3,用户可以打开 AI Test Kitchen 体验该功能,官方称最新版本“细节更清晰、光照更丰富、干扰性人工痕迹更少”。
谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。
谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。
在谷歌的人工和自动评估中,Imagen 3 的表现优于 Imagen 2、DALL-E 3、Midjourney v6、Stable Diffusion 3 和 Stable Diffusion XL 1.0,Imagen 3 在将文本描述与生成的图像相匹配以及处理详细提示方面表现尤为突出。
IT之家附上网友分享的对比图如下:
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。