Stable Diffusion
DDPM 模型
基础模型:DDPM(Denoising Diffusion Probabilistic Model)
普通的生成模型:GAN、VAE
- DDPM 分解,加噪声
- DDPM 重构,去噪声
加噪声:
当 增大的时候, 不断变大。
训练神经网络损失函数:
其中 为 U-net 神经网络, 为噪声强度,其中 为损失权重。
重构过程:
而实际应用中需要加入随机性,所以其表达式如下:
将模型视为概率模型,那么前一个部分的表达式可以看做均值,而随机噪声部分可以看做方差。
Text2Img 模式
- 引入 Encoder 和 Decoder,对输入的图像进行降维,在潜空间(latents)上进行 DDPM
- 在噪声估计时引入了文本作为条件
噪声估计:
Img2Img 模式
Img2Img-Mask 模式
私炉模式
文本反演(Textual Inversion)