Diffusion详谈
Wed Apr 02 2025
240 words · 3 minutes

Diffusion详谈


Table of Contents

Tutorial on Diffusion Models for Imaging and Vision Link to Tutorial on Diffusion Models for Imaging and Vision

VAE Link to VAE

1.1 构建 Link to 1.1 构建

image-20250402223047344

VAE就是一个图像xx输入,经过encoder编码为隐变量zz,最后经过decoder解码为x^\hat{x}

我们期望,解码得到的x^\hat{x}能和xx尽可能一样。

下面介绍几个概率分布来表示VAE中的变量:

  • p(x)p(x):未知的,xx的分布;
  • p(z)p(z)zz的分布,人为定义为均值为0方差为1的高斯分布,理由为任何概率分布都可以转变为高斯分布;
  • p(zx)p(z|x):给定xxzz的分布,和encoder相关,未知的;
  • p(xz)p(x|z):给定zzxx的分布,和decoder相关,未知的;
  • qϕ(zx)q_{\phi}(z|x):作为p(zx)p(z|x)的代理分布;
  • pθ(xz)p_{\theta}(x|z):作为p(xz)p(x|z)的代理分布。
image-20250402224020385

1.2 ELBO Link to 1.2 ELBO

Thanks for reading!

Diffusion详谈

Wed Apr 02 2025
240 words · 3 minutes