Dreambooth工作原理

最新推荐文章于 2025-05-22 10:15:07 发布

原创

最新推荐文章于 2025-05-22 10:15:07 发布 · 4.2k 阅读

·

4

·

标签

#机器学习 #stable diffusion #Dreambooth

Dreambooth是Google研发的一种技术，通过注入自定义主题微调扩散模型，如StableDiffusion。它避免了过拟合和语言漂移问题，通过命名照片主体和预设类别实现个性化生成。虽然不如LoRA，但能对照片进行风格调整。

什么是Dreambooth

中文名：梦想亭。

Dreambooth 由 Google 研究团队于 2022 年发布，是一种通过向模型注入自定义主题来微调扩散模型（如稳定扩散）的技术。
所谓自定义主体，就是一张照片，但是照片主体要鲜明。比如一张小狗狗照片，那么狗和背景要有很高的区分度。

在这里插入图片描述

官方给出的一个例子：左边是三张小狗照片，通过dreamboothed 模型后，就能生成右边不同的照片。

小节下：就是使用少量的照片，给到dreamboothed 模型，dreamboothed 模型就能生成出风格不同的照片来。

为什么不直接训练照片呢？

为什么不直接使用这些照片来训练模型呢？因为少量的照片去训练，会造成过拟合和语言漂移的问题。

语言漂移 (Language drift)

用一个成语来形容它：流变不居。

“Language drift”（语言漂移）是指在机器学习中，训练模型的语言或数据分布与实际应用环境中的语言或数据分布之间的差异或变化。这种差异可能会导致模型在实际应用中表现不佳。

具体来说，语言漂移可能出现在以下情况：

时间漂移（Temporal Drift）：语言随着时间的推移而变化。例如，社交媒体上的流行词汇、俚语或新兴语言可能会不断变化，而训练模型的数据可能是以前的数据，无法跟上最新的语言趋势。
领域漂移（Domain Drift）：语言在不同领

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

山鬼谣me 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。