前言
更新: Invalid Date 字数: 0 字 时长: 0 分钟
🍊Hello,各位好,我是面包!
这篇文章记录了一些我在写论文时对扩散模型的的一些理解。
扩散过程:对原始图片进行噪声变换的过程,分为前向扩散和反向生成,前向扩散是图片不断添加高斯噪声的过程,后向生成是添加噪声之后的图片不断减去噪声的过程。
VAE:一种将图像数据进行压缩方式所依赖的模型,包括解码和编码。
CLIP有两种模态,分别呈现为文本编码器和视觉编码器,它们分别将文本和图像转化为嵌入向量对采样器进行特征修饰,使生成的图片不断趋近于期望的图片。
模型
让机器通过500字的中心思想和梗概去扩写出一篇1万字的文章出来,和原文章肯定不是每字每句都相同的,但看过的人一对比发现和原文章竟然大体上雷同。这个过程便是人工智能的训练学习的过程。我们经常说的大模型训练就是这个意思,学习训练出来的规律总和,就叫“模型”。 知乎