diffusion blog
diffusion blog
data:image/s3,"s3://crabby-images/fb621/fb62113d821be8f5415de9f8f0d47582d03c2c95" alt=""
可以一步计算任何t时刻的正向传播
data:image/s3,"s3://crabby-images/c3737/c3737fb3f41aa522323a8c77334fbb26e74befb1" alt=""
虽然逆向顺序没法算
但是:可以通过引入作为条件,然后用正向的一步表达式的反演又把从的表达式中去掉,达到从导出的inverse diffusion process的效果
data:image/s3,"s3://crabby-images/c6ad7/c6ad791eeb69f00d7803f1d7425628b2fd9b8c77" alt=""
data:image/s3,"s3://crabby-images/44de1/44de1efebeaa0e322a31df294c7e869d3e62a7d2" alt=""
data:image/s3,"s3://crabby-images/bcd00/bcd006636261e492bffab90d51341a31d33eb438" alt=""
这里的是由x0和xt计算出来的
data:image/s3,"s3://crabby-images/c8462/c8462493888bb74bc254952f1743bd7a78b13b81" alt=""
同上,对于理解式子很重要,这里道理应该是given了xt。
只不过loss function里面反演的是epsilon
data:image/s3,"s3://crabby-images/8a519/8a519410dd535c41f60c2e37566f13569c740062" alt=""
data:image/s3,"s3://crabby-images/4d5eb/4d5ebd15aa48a4da84b32141b676c171a85a984c" alt=""
data:image/s3,"s3://crabby-images/e5409/e540946b20979732dc093aaddfc6f6a4dbd94215" alt=""
DDIM has the same marginal noise distribution but deterministically maps noise back to the original data samples.
因为是DDIM确定性(方差是0),所以可以跳步骤。
但是既然是确定性的,为什么不能直接跳到最后?
因为这里式子是从X_t强行变换出来的,即使没有扰动,预测能力本来是对标t-1,强行依靠正向的闭合式子和当前已知的x^t跳跃是可以,但是能力有限,否则直接从噪音跳到图片网络做不到。
但是正是因为去掉了每次出噪音,ddim可以加速这个过程,一次跳几步还是可以的。
很好的ddim解释:https://zhuanlan.zhihu.com/p/7185787461
ddim其实是拿掉了马尔科夫性,且额外引入了先验gaussian(范围比ddpm更广
2. 保留了方差作为待定变量,gaussian的其它系数用待定系数法反解出来
3. 用KL作为loss训练
4. 当方差取一定数值时,就是ddpm
5. 一般我们用ddim时方差取0,称取0时为ddim
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.