DDIM - 标签 - 军舰的日志

灵感来源于物理学，你可以想像一滴墨水滴入一杯水中，最初你确切地知道它落在哪里，但随着时间的推移，你看到到扩散到水中，直到消失。

神经网络真正应该思考的是在每个噪声级别，当你逐渐向图像添加噪声时：

Bob the Sprite!: 如果是 Bob Sprite，你想让神经网络说那是 Bob Sprite，让 Bob 保持原样。
Probable Bob: 如果可能是 Bob Sprite，你可能想让神经网络说你知道这里有些噪声，建议可能填写的详细信息，让它看起来就像 Bob Sprite。
Well, Bob or Fred...: 如果它只是精灵的轮廓，你想建议可能的精灵的一般细节。
No Idea: 如果看起来什么也不知道，建议提出什么是轮廓，让它看起来更像精灵。

它学会消除您添加的噪声。

"No Idea" 的噪声级别很重要，因为它是正态分布的，每一个像素的采样都来自于正态分布。正态分布也可以称为 Gaussian distribution 或 bell shaped curve

当你向神经网络请求一个新的精灵时：

NN 试图完全预测每一步的噪声。实际上，这只是一个预测。您需要多个 step 才能获得高质量的精灵。

2023年6月14日 6 分钟 1,638 字

1 篇文章带有标签 “DDIM”