您的位置：首页 > 新闻 > 会展 > 【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路

【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路

2025/7/10 9:39:51 来源：https://blog.csdn.net/weixin_43154149/article/details/140441769 浏览: 次关键词：【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路

文章目录

- 图片生成Framework 需要3个组件：
- - 相关论文【Stable Diffusion，DALL-E，Imagen】
- 具体介绍三个组件
- - 1. Text encoder介绍【结论：文字的encoder重要，Diffusion的模型不是很重要！】
  - - 评估指标：FID计算
    - CLIP Score 计算
  - 3. Decoder介绍【不需要成对的训练资料】
  - 2. Diffusion Model介绍【训练一个noise predicter】
  - - noise 加在 latent representation上

from: https://www.youtube.com/watch?v=JbfcAaBT66U&list=PLJV_el3uVTsNi7PgekEUFsyVllAJXRsP-&index=5

简介：

84,841次观看 2023年3月25日【機器學習 2023】(生成式 AI)
感謝黃敬峰先生提供字幕

Stable Diffusion
https://arxiv.org/abs/2112.10752

DALL-E series
https://arxiv.org/abs/2204.06125
https://arxiv.org/abs/2102.12092

Imagen
https://arxiv.org/abs/2205.11487

图片生成Framework 需要3个组件：

Text Encoder
Generation Model
Decoder

在这里插入图片描述

相关论文【Stable Diffusion，DALL-E，Imagen】

在这里插入图片描述

在这里插入图片描述

具体介绍三个组件

在这里插入图片描述

1. Text encoder介绍【结论：文字的encoder重要，Diffusion的模型不是很重要！】

在这里插入图片描述

评估指标：FID计算

在这里插入图片描述

CLIP Score 计算

在这里插入图片描述

3. Decoder介绍【不需要成对的训练资料】

在这里插入图片描述

在这里插入图片描述

2. Diffusion Model介绍【训练一个noise predicter】

在这里插入图片描述

noise 加在 latent representation上

在这里插入图片描述

在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

最新新闻

热搜词

解决了AI聊天的10个痛点后，我又做了一个新功能：交叉分析表如何在生产环境中优化.net_core项目性能 .net_core中的依赖注入容器支持哪些特性用 Julia 实现彩色验证码的颜色通道分析与字符增强识别 linux下用ping占满上传带宽值得去的国企名单（上海篇）

声明：本站所有新闻及新闻图片来源于其他网站，如有侵权，请及时联系我们！

客户服务 | 关于我们 | 版权声明

版权所有：

Copyright 2024 尧图网 All Rights Reserved.QQ:809451989