当前位置:网站首页>[论文阅读] Unpaired Image-to-Image Translation Using Adversarial Consistency Loss
[论文阅读] Unpaired Image-to-Image Translation Using Adversarial Consistency Loss
2022-08-04 09:51:00 【xiongxyowo】
Abstract
未配对的图像-图像转换是一类视觉问题,其目标是利用未配对的训练数据找到不同图像域之间的映射。循环一致性损失是这类问题中广泛使用的约束条件。然而,由于严格的像素级约束,它不能进行形状改变,去除大型物体,或忽略不相关的纹理。在本文中,我们提出了一种新的对抗性一致性损失,用于图像到图像的翻译。这种损失不要求翻译后的图像被翻译成特定的源图像,但可以鼓励翻译后的图像保留源图像的重要特征,并克服上述循环一致性损失的缺点。我们的方法在三个具有挑战性的任务上取得了最先进的结果:摘除眼镜、男性到女性的翻译和自拍到动漫的翻译。
Method
本文是CycleGAN的一种改进。CycleGAN可以认为是一种自监督的图像风格转换网络,主要不足在于难以去改变图像的几何性质(风格转换可以认为只改了颜色),因此在一些需要改变形状的场景上表现不佳。用高级的一些话来说,就是风格转换任务实际上存在一个"循环一致性"假设,因此不满足这一假设的任务是无法直接去套用循环一致性损失的。事实上,对于许多任务,源域的某些特征是没必要保留的,保留的话反而会导致生成结果中存在伪像(artefact),此时就不能去用像素级的损失函数来进行约束。
本文的框架如下所示:
左图对于输入的源域图像 x S x_S xS,加入一定的噪声 z 3 z_3 z3后,首先经过源域本身的生成器 G S G_S GS,能够得到一组与原始图像 x S x_S xS十分相似的图像 x ~ S \tilde{x}_S x~S。相较于传统的直接将原图像 x S x_S xS输入目标域生成器 G T G_T GT已获得翻译后的结果,本文将原始图像的邻域 x ~ S \tilde{x}_S x~S输入 G T G_T GT(这里加入了噪声 z 1 z_1 z1以实现多样化结果生成),得到翻译后的一组结果 x ˉ T \bar{x}_T xˉT。 x ˉ T \bar{x}_T xˉT再经过源域生成器重建回原始图像邻域 x ~ S \tilde{x}_S x~S。
这么做从两个层面放松了严格的一致性约束。首先,只需要两个邻域(原始图像邻域与重建图像邻域)相近即可,而非严格的单张原始图像与单张重建图像相近;第二,衡量两个邻域是否相近是使用一个额外的判别器来完成的,而非CycleGAN中使用的像素级L1损失。
右图 对于输入的单张源域/目标域图像,相应的生成器要能够对其进行重建。即源域=>源域,目标域=>目标域这两个过程对图像的修改应该尽可能有限,这样就能保证上面所生成的邻域不会过于宽泛。注意,这一步是没有向生成器加入噪声的,所以理想状态下输入输出图像应该是完全一致的。
边栏推荐
- Layer 3 Switch/Router OSPF Configuration Details [Huawei eNSP Experiment]
- MindSpore:mirrorpad算子速度过慢的问题
- 【正点原子STM32连载】第四章 STM32初体验 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
- 暴力破解ssh/rdp/mysql/smb服务
- MySQL binlog都有哪些模式?
- Win11系统重装用什么好 一键重装Win11教程
- Win11文件资源管理器找不到选项卡怎么办?
- MindSpore:图算融合报错
- 【cookie 临时存储数据,WebStorage ,sessionStorage】
- leetcode经典例题——56.合并区间
猜你喜欢
云函数实现网站自动化签到配置详解【Web函数/Nodejs/cookie】
2022 Cloud Native Computing代表厂商 | 灵雀云第三次入选Gartner中国ICT技术成熟度曲线报告
Layer 3 Switch/Router OSPF Configuration Details [Huawei eNSP Experiment]
NAT/NAPT地址转换(内外网通信)技术详解【华为eNSP】
LeetCode中等题之旋转图像
开源一夏 | 查询分页不只有limit,这四种分页方法值得掌握
【正点原子STM32连载】第三章 开发环境搭建 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
[Cloud Residency Co-Creation] HCSD Celebrity Live Streaming – Employment Guide
罗克韦尔AB PLC RSLogix5000中定时器指令使用方法介绍
No module named 'flask_misaka' has been resolved [BUG solution]
随机推荐
【正点原子STM32连载】第三章 开发环境搭建 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
LeetCode 54. 螺旋矩阵 蛇形矩阵式输出字符串
leetcode经典例题——56.合并区间
请问下Flink SQL如何写hologres分区表?我想要每天一个分区
Get the number of cpu cores
[Punctuality Atom STM32 Serial] Chapter 4 STM32 First Experience Excerpted from [Punctual Atom] MiniPro STM32H750 Development Guide_V1.1
The difference between Mysql application log time and system time is eight hours
ps抠图怎么抠出来,自学ps软件photoshop2022,ps怎么抠出想要的部分-笔记记录
关于ARM2440中断源个数的一点想法[通俗易懂]
Win11文件资源管理器找不到选项卡怎么办?
渗透——信息收集
cannot import name ‘import_string‘ from ‘werkzeug‘【bug解决】
Techwiz OLED:OLED器件的发光效率
sqlilabs less-38~39
【c】操作符详解(二)
【正点原子STM32连载】第一章 本书学习方法 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
leetcode动态规划经典例题——53.最大子数组和
EastWave应用:自动计算光子晶体透反率
LeetCode中等题之旋转图像
Detailed explanation of NAT/NAPT address translation (internal and external network communication) technology [Huawei eNSP]