每日一博 | 35 张图,直观理解 Stable Diffusion
作者|Jay Alammar 翻译|杨婷、徐佳渝 最近,AI图像生成引人注目,它能够根据文字描述生成精美图像,这极大地改变了人们的图像创作方式。 Stable Diffusion 作为一款高性能模型,它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小,是AI图像生成领域的里程碑。 在接触了AI图像生成以后,你可能会好奇这些模型背后的工作原理。 下面是对Stable Diffusion工作原理的概述。 Stable Diffusion用途多样,是一款多功能模型。首先它可以根据文本生成图像(text2img)。上图是从文本输入到图像生成的示例。除此之外,我们还可以使用Stable Diffusion来替换、更改图像(这时我们需要同时输入文本和图像)。 下面是Stable Diffusion的内部结构,了解内部结构可以让我们更好地理解Stable Diffusion的组成、各组成部分的交互方式、以及各种图像生成选项/参数的含义。 1 Stable Diffusion的组成 Stable Diffusion并不是一个单一模型,而是由多个部分和模型一起构成的系统...




