.hd-box .hd-fr

Nano Banana Pro 新对手,智谱联合华为开源首个国产芯片训练的多模态 SOTA 模型 GLM-Image

2026-01-14 09:11IT之家(汪淼)38评
感谢IT之家网友三元不二Kazuto的线索投递!

IT之家 1 月 14 日消息,智谱今日宣布联合华为开源新一代图像生成模型GLM-Image,模型基于昇腾 Atlas 800T A2 设备和昇思 MindSpore AI 框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的 SOTA 多模态模型

GLM-Image 采用自主创新的“自回归 + 扩散解码器”混合架构,实现了图像生成与语言模型的联合

IT之家附 GLM-Image 核心亮点如下:

据智谱官方介绍,通过改进 Tokenizer 策略,GLM-Image 能够自适应处理多种分辨率,原生支持从 1024x1024 到 2048×2048 尺寸的任意比例图像的生成任务,无需重新训练。

GLM-Image 在文字渲染的权威榜单中达到开源 SOTA 水平

GLM-Image 在实际的复杂图文任务中测试表现如下:

场景一:科普插画

GLM-Image 更擅长绘制包含复杂逻辑流程与文字说明的科普插画及原理示意图。

场景二:多格图画

在生成电商图、漫画等多格图画时,GLM-Image 能够保持风格和主体的一致性,并保障多处文字生成的准确率。

场景三:社交媒体图文封面

GLM-Image 适用于制作社交媒体封面及内容等排版复杂的图片,让您的创作更自由丰富。

场景四:商业海报

GLM-Image 能够生成构图富有设计感、文字嵌入准确的节日海报与商业宣传图。

场景五:写实摄影

在文字渲染以外,GLM-Image 也同样擅长生成各种景别和尺寸的人像、宠物、风景、静物。

IT之家附 GLM-Image 体验和开源地址如下:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论