
Table of Contents
Image Harmonization系列文章 Link to Image Harmonization系列文章
HarmonPaint: Harmonized Training-Free Diffusion Inpainting Link to HarmonPaint: Harmonized Training-Free Diffusion Inpainting
思路
在 U-Net 解码器里的自注意力(self-attention),我们有 Q、K、V。K 和 V 里包含风格信息。
计算未遮挡区域所有 patch 的 K 的均值(认为它代表整幅图的“整体风格”)。
然后用一个掩码 去更新 K(V 同理):
含义:被遮挡区的Key特征被整体风格代表 替换,这样注意力会把未遮挡区的风格“拉”进来,使得生成区域风格对齐。
自注意力计算
- 将原始 Key与平均风格 Key 拼接,并通过 控制 的影响力。
- 这样可以同时保留局部结构信息和整体风格信息。
Thanks for reading!
Image Harmonization系列文章
© JuneSnow | CC BY-SA 4.0