Stability AI 推出 Stable Diffusion XL Turbo 模型，仅需一次迭代即可生成高品质图像

2023-11-30 13:59 IT之家 - 漾仔（实习）

感谢IT之家网友溯波的线索投递！

IT之家 11 月 30 日消息，Stability AI 日前推出了 Stable Diffusion XL Turbo（SDXL Turbo），为此前 SDXL 模型的改进版本，号称采用了“对抗性扩散蒸馏技术（Adversarial Diffusion Distillation）”，将图片生成迭代步骤从原先的 50 步减少至 1 步，据称“仅仅进行一次迭代步骤就能生成高品质图像”。

据悉，Stable Diffusion XL Turbo 模型的最大特点，就是上述“一次迭代生成图像”，号称可以进行“即时文字转图像输出”，并能够保证图片的质量。

而其中的“对抗性扩散蒸馏技术”是以现有的大型图像扩散模型，作为“教师网络”来指导模型的生成过程，结合了“蒸馏技术”和“对抗训练”，其中“蒸馏技术”即“蒸馏模型知识，精炼模型输出”，将大型模型的知识浓缩到更小的模型中，而对抗性训练则可以改进模型，以更好地模仿教师模型输出。

此前的模型蒸馏技术难以兼顾效率和品质，这是因为快速采样通常会削弱输出品质，因此本次 Stable Diffusion XL Turbo 模型在通过“对抗性扩散蒸馏技术”在高效生成高品质图像方面，是一个重要的进步。

官方将 Stable Diffusion XL Turbo 与多个不同的模型变体进行比较，包括 StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL，并进行了两项实验，第一个实验要求模型评估人员随机查看两项模型的输出，并选择出其中最符合提示词的输出图像，第二项实验则与第一项实验执行大致相同，模型评估要求选择模型中输出者图像品质最佳的一方。

▲ 图源 Stability AI 博客

实验结果显示，Stable Diffusion XL Turbo 在大幅降低运算需求的同时，仍可以保持良好的图像生成品质，该模型单词迭代，即胜过 4 次迭代的 LCM-XL，而 4 次迭代的 Stable Diffusion XL Turbo 就可击败此前经过 50 步迭代配置的 Stable Diffusion XL；在 A100 GPU 上，计算 512x512 分辨率的图像，只需 207 毫秒。

IT之家注意到，目前 Stability AI 已经将相关代码公布在 Hugging Face，供个人和非商业用途使用，感兴趣的小伙伴们可以点此访问。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。