当前位置:网站首页>基于深度学习的参考帧生成
基于深度学习的参考帧生成
2022-07-06 12:46:00 【Dillon2015】
本文来自提案JVET-T0058和JVET-U0087,该方法通过插帧的方法生成虚拟参考帧用于帧间预测。整个模型由几个子模型组成,分别进行光流估计、补偿和细节增强。
整体架构

整体架构如Fig.1所示,在视频编码过程中DPB中存着用于运动估计的参考帧,根据GOP结构当前帧有一个或多个前向、后向参考帧。提案中默认使用POC距离当前帧最近的两个参考帧生成虚拟参考帧,如Fig.1中当前帧POC是5,则使用POC为4和6的帧生成参考帧。生成的虚拟参考帧会被放入DPB用于参考,虚拟参考帧的POC设置为和当前帧相同。为了防止影响时域MVP中根据POC距离的MV缩放过程,虚拟参考帧的MV都设为0且被用作长期参考帧。在提案中,当前帧解码完成后虚拟参考帧就从DPB中移除。
对于高分辨率序列(4K或8K)由于资源受限不能对整帧直接使用神经网络处理,此时假设虚拟参考帧被分为多个区域,每个区域单独使用网络生成,然后将这些区域拼成参考帧。
网络模型
一般的视频插帧大都利用了光流估计和补偿,一般使用双向光流方法,然后通过一个线性模型将两个光流合成一个。提案中仅使用单光流模型。

如Fig.2,首先通过光流估计模型生成光流(输入为POC距离最近的两个参考帧),然后通过backward warping过程处理光流,处理后的光流和两个参考帧再通过fusion过程合成中间帧。中间帧会通过细节增强模型提升质量,细节增强模型包含两部分,PCD(Pyramid, Cascading and Deformable)用于时空优化和TSA (Temporal and Spatial Attention)用于提高重要特征的attention。
实验结果

感兴趣的请关注微信公众号Video Coding

边栏推荐
- How does kubernetes support stateful applications through statefulset? (07)
- 【每周一坑】输出三角形
- Application layer of tcp/ip protocol cluster
- 7、数据权限注解
- C language games - three chess
- Solution to the 38th weekly match of acwing
- 【DSP】【第一篇】开始DSP学习
- 【OpenCV 例程200篇】220.对图像进行马赛克处理
- Tips for web development: skillfully use ThreadLocal to avoid layer by layer value transmission
- Basic knowledge of lists
猜你喜欢

2022 refrigeration and air conditioning equipment installation and repair examination contents and new version of refrigeration and air conditioning equipment installation and repair examination quest

Core principles of video games

"Penalty kick" games

使用.Net驱动Jetson Nano的OLED显示屏

The most comprehensive new database in the whole network, multidimensional table platform inventory note, flowus, airtable, seatable, Vig table Vika, flying Book Multidimensional table, heipayun, Zhix

Manifest of SAP ui5 framework json
![[diy] how to make a personalized radio](/img/fc/a371322258131d1dc617ce18490baf.jpg)
[diy] how to make a personalized radio
![[weekly pit] output triangle](/img/d8/a367c26b51d9dbaf53bf4fe2a13917.png)
[weekly pit] output triangle

Logic is a good thing

防火墙基础之外网服务器区部署和双机热备
随机推荐
2110 summary of knowledge points and common problems in redis class
Entity alignment two of knowledge map
Value of APS application in food industry
Mtcnn face detection
OSPF多区域配置
【微信小程序】運行機制和更新機制
"Penalty kick" games
1500万员工轻松管理,云原生数据库GaussDB让HR办公更高效
Select data Column subset in table R [duplicate] - select subset of columns in data table R [duplicate]
正则表达式收集
'class file has wrong version 52.0, should be 50.0' - class file has wrong version 52.0, should be 50.0
Comprehensive evaluation and recommendation of the most comprehensive knowledge base management tools in the whole network: flowus, baklib, jiandaoyun, ones wiki, pingcode, seed, mebox, Yifang cloud,
Performance test process and plan
How to turn a multi digit number into a digital list
Common doubts about the introduction of APS by enterprises
Swagger UI教程 API 文档神器
Web开发小妙招:巧用ThreadLocal规避层层传值
每个程序员必须掌握的常用英语词汇(建议收藏)
Core principles of video games
Notes - detailed steps of training, testing and verification of yolo-v4-tiny source code