admin管理员组文章数量:1122849
Free
CVPR 2020的一篇文章
解读一下题目:
- free form 自由形式
- image inpainting 图像补全
- gated convolution 门控卷积
该文章提出了一个,缺失区域为自由形式的图像补全情况的解决方法,针对该方法提出了一个门控卷积的方法。
模型结构图如下:
不通篇翻译了,直接进行论文有价值部分分享
问题:
- 以前的image inpainting任务的mask都是一个固定大小的矩形。
- 传统的补全方法,卷积滤波器在对图像进行计算的过程中存在不合理性:
– 有时,卷积滤波器处理的像素全部为mask部分,有时,处理的全部为gt像素,有时,处理的是gt像素和msk像素的边界。
– 卷积滤波器对待gt像素和mask像素是同等对待的,包括边界情况也同等方式计算,这样不合理。
针对以上问题,作者提出一个gated convolution方法
公式中,前两行是两个卷积运算。
其中 I I I 是原始图像。 W g W_g Wg是gated卷积核参数, W f W_f Wf是feature卷积核参数。原图像分别经过两个不同的滤波器得到门控信息 G a t i n g Gating Gating和特征 F e a t u r e Feature Feature,最终的输出 O O O是两部分分别经过激活函数后做element-wise乘法得到。我认为该方法看似有其合理性,理想是Gating收集门控信息,哪些像素值得被信任,哪些像素要信任的少一些,然后对提取出来的特征进行一部分削弱。
除了该方法外,文章中还提出下面一些可圈可点的创新
改进了对抗网络 Spectral-Normalized Markovian Discriminator (SN-PatchGAN)
判别器网络如上图。在图像补全的以往判别器中,一般分成两个分支:
- 全局判别
观察补全后的整张图像是否合理 - 局部判别
观察补全区域是否合理
但在该任务中,缺失部分mask为free form 任意形式,所以无法判别局部的情况了。
在该方法中,作者提出了如上图的判别网络,将原图像压缩后,生成一个特征图,特征图的每个像素对应原始图像的一个小区域。该判别器在特征图的每个像素进行判别,也就是判别对应原图像的每个区域的合理性。
任意形式的mask生成 Free-Form Mask Generation
用了一些随机的划线条,来模拟人画出来的mask。为了让线条连接平滑一些,线条边缘画了一些圆
用户引导图像补全 Extension to User-Guided Image Inpainting
除了mask之外,人在画一些形状,输入给网络引导图像补全。
loss function
该方法loss function为reconstruction loss 和 对抗损失 两部分
重建损失 可以理解为 像素对像素的 差距损失。
贴一些实验结果
本文标签: Free
版权声明:本文标题:Free 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/web/1686654246a20863.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论