Rain-Bus/Obsidian

Files

RainBus 0f34f02941 vault backup: 2024-04-26 10:52:16

2024-04-26 10:52:16 +08:00

569 B

Raw Blame History

研究动机

当前模型缺陷

编辑方式受限：只能转换风格/添加物体
编辑对象受限：特定域/仅能处理合成图像
需要辅助输入：mask

本文模型优势

仅需要一段修改描述和图像

方法

Text embedding optimize
1. 通过文本编码器获得$e_{tgt}$，其中$e_{tgt} \in R^{T * d}$。
2. 冻结Diffusion模型参数，对$e$进行优化。
Diffusion Model fine-tuning
Linear interpolation \bar e = \eta \cdot e_{tgt} + (1 - \eta) \cdot e_{opt}