当前位置:网站首页>论文精度 —— 2017 CVPR《High-Resolution Image Inpainting using Multi-Scale Neural Patch Synthesis》
论文精度 —— 2017 CVPR《High-Resolution Image Inpainting using Multi-Scale Neural Patch Synthesis》
2022-08-11 03:07:00 【clarkjs】
总述
和上一篇blog一样,这篇论文很大程度上也借鉴了开山之作《Context Encoders: Feature Learning by Inpainting》的思想,使用encoder-decoder结构进行图片的生成,但是之前的这篇论文有很大的缺陷,其中较为明显的不足就是补全的结果较为模糊(纹理上技术较差),而且输入图像的规模固定,为128*128,且不能处理高分辨率的图像(请注意,对于上下文编码器,高分辨率结果是通过从低分辨率输出直接上采样获得的。)。鉴于此,这篇paper创新地提出了多尺度的神经补丁,既进行内容的学习,也进行纹理的学习,最后形成一个内容和纹理都较为出色的模型。注:这个思想和同年发表在ACM顶会上的《Globally and Locally Consistent Image Completion》有异曲同工之妙,它这篇paper的核心创新是利用CE的生成器,创新地提出两个鉴别器,全局的和局部的,其实就是全局上考虑内容填充的正确性,局部上(空白区域和周围的一小部分)考虑纹理,可以理解为细节的契合度。
一、方法详述
1. 网络结构
网络分类两部分:(1)内容生成网络(将图像的中心缺失的方形掩码用平均像素颜色进行填充后输入进网络);(2)纹理生成网络,内容生成网络采用开山之作的CE生成器方法,纹理生成网络采用使用ImageNet预训练好的VGG-19.
在纹理生成网络中使用relu3_1和relu4_1层来计算纹理。
边栏推荐
- Meaning of df and df -lh
- 解决vim与外界的复制粘贴(不用安装插件)
- CC0 与商业 IP:哪种模式更适合 NFT?
- The negative semantic transformation layer
- Entity to Vo conversion
- A Practical Arrangement of Map GIS Development Matters (Part 1)
- 最倒霉与最幸运
- MySQL的主从复制+读写分离+分库分表,看这一篇文章就够了
- Salesforce disbands the Chinese team, which CRM product is more suitable for the Chinese
- 7 sorting algorithms that are often tested in interviews
猜你喜欢
随机推荐
Ninjutsu_v3_08_2020 - safety penetrating system installation
[BX]和loop
MongoDB 基础了解(二)
A surviving spouse of the opposite sex within large turn paragraph, what for
什么是三方支付?
VIT 源码详解
js中的this问题
增加对 Textbundle 的支持
按摩椅控制板的开发让按摩椅变得简约智能
leetcode:358. K 距离间隔重排字符串
基于改进YOLOv5轻量化的烟火检测
Talk about the understanding of RPC
ES进阶 数组功能语法新特性详解
“京台高铁”亮相百度地图,真能在2035年建成吗?
互换性测量与技术——偏差与公差的计算,公差图的绘制,配合与公差等级的选择方法
CC0 与商业 IP:哪种模式更适合 NFT?
CSDN blog replacement skin
What does the sanction of the mixer Tornado mean for the DeFi market?
(CVPR-2017)在身体和潜在部位学习深度上下文感知特征以进行行人重识别
《人生若如初见》命运多舛,人物饱满,朱亚文角色反差太惊喜









