🌶怎么对AI生图进行专业性描述？
从原理出发，逐步解析扩散模型的奥秘

前言

更新: Invalid Date 字数: 0 字时长: 0 分钟

🍊Hello，各位好，我是面包！
这篇文章记录了一些我在写论文时对扩散模型的的一些理解。

扩散过程:对原始图片进行噪声变换的过程，分为前向扩散和反向生成，前向扩散是图片不断添加高斯噪声的过程，后向生成是添加噪声之后的图片不断减去噪声的过程。

VAE:一种将图像数据进行压缩方式所依赖的模型，包括解码和编码。

CLIP有两种模态，分别呈现为文本编码器和视觉编码器，它们分别将文本和图像转化为嵌入向量对采样器进行特征修饰，使生成的图片不断趋近于期望的图片。

模型

让机器通过500字的中心思想和梗概去扩写出一篇1万字的文章出来，和原文章肯定不是每字每句都相同的，但看过的人一对比发现和原文章竟然大体上雷同。这个过程便是人工智能的训练学习的过程。我们经常说的大模型训练就是这个意思，学习训练出来的规律总和，就叫“模型”。知乎

前言 ​