2015
早期理论与方法论雏形
一些研究把扩散与能量/热力学概念引入生成建模(例如 nonequilibrium thermodynamics 的思想),奠定了后续扩散概率模型的理论基础。
从早期理论到近年主流模型的关键里程碑——便于阅读与快速查阅的单页 HTML 时间线
一些研究把扩散与能量/热力学概念引入生成建模(例如 nonequilibrium thermodynamics 的思想),奠定了后续扩散概率模型的理论基础。
在此阶段,GAN(生成对抗网络)与 VAE(变分自编码器)仍然是图像生成领域的主流,扩散模型尚处于概念与早期实验阶段。
Jonathan Ho 等人提出 DDPM,通过正向加噪与反向去噪的概率框架证明扩散模型在图像生成上可达到与 GAN 可比甚至更优的质量,成为现代扩散方法的起点。
围绕采样速度和采样质量,出现了 DDIM 等方法,显著减少采样步骤,提高可用性与体验。
将自然语言提示(prompt)与条件扩散结合,开始探索 text-to-image 的可行性,为下一步的爆发做准备。
Stable Diffusion(潜在空间扩散)开源,使高质量图像生成大众化;OpenAI 的 DALL·E 2 等多模态方案也推动了大规模商用与创作浪潮。
更多变种、加速技术、多模态融合方法涌现,扩散模型成为生成式 AI 的主流技术,应用从科研扩散到创作、设计与商业服务。
持续优化采样速度、可控性、多样性与小样本/条件生成能力;扩散技术与其它生成范式(如隐空间建模、神经渲染等)逐步融合。