当前位置:网站首页>基于深度学习的参考帧生成
基于深度学习的参考帧生成
2022-07-06 12:46:00 【Dillon2015】
本文来自提案JVET-T0058和JVET-U0087,该方法通过插帧的方法生成虚拟参考帧用于帧间预测。整个模型由几个子模型组成,分别进行光流估计、补偿和细节增强。
整体架构

整体架构如Fig.1所示,在视频编码过程中DPB中存着用于运动估计的参考帧,根据GOP结构当前帧有一个或多个前向、后向参考帧。提案中默认使用POC距离当前帧最近的两个参考帧生成虚拟参考帧,如Fig.1中当前帧POC是5,则使用POC为4和6的帧生成参考帧。生成的虚拟参考帧会被放入DPB用于参考,虚拟参考帧的POC设置为和当前帧相同。为了防止影响时域MVP中根据POC距离的MV缩放过程,虚拟参考帧的MV都设为0且被用作长期参考帧。在提案中,当前帧解码完成后虚拟参考帧就从DPB中移除。
对于高分辨率序列(4K或8K)由于资源受限不能对整帧直接使用神经网络处理,此时假设虚拟参考帧被分为多个区域,每个区域单独使用网络生成,然后将这些区域拼成参考帧。
网络模型
一般的视频插帧大都利用了光流估计和补偿,一般使用双向光流方法,然后通过一个线性模型将两个光流合成一个。提案中仅使用单光流模型。

如Fig.2,首先通过光流估计模型生成光流(输入为POC距离最近的两个参考帧),然后通过backward warping过程处理光流,处理后的光流和两个参考帧再通过fusion过程合成中间帧。中间帧会通过细节增强模型提升质量,细节增强模型包含两部分,PCD(Pyramid, Cascading and Deformable)用于时空优化和TSA (Temporal and Spatial Attention)用于提高重要特征的attention。
实验结果

感兴趣的请关注微信公众号Video Coding

边栏推荐
- 使用.Net分析.Net达人挑战赛参与情况
- How to turn a multi digit number into a digital list
- Web开发小妙招:巧用ThreadLocal规避层层传值
- 拼多多败诉,砍价始终差0.9%一案宣判;微信内测同一手机号可注册两个账号功能;2022年度菲尔兹奖公布|极客头条
- Design your security architecture OKR
- 请问sql group by 语句问题
- 【mysql】触发器
- APS taps home appliance industry into new growth points
- SAP Fiori应用索引大全工具和 SAP Fiori Tools 的使用介绍
- (工作记录)2020年3月11日至2021年3月15日
猜你喜欢

【mysql】触发器

【微信小程序】运行机制和更新机制

SAP UI5 框架的 manifest.json

电子游戏的核心原理

Quel genre de programmation les enfants apprennent - ils?

Comprehensive evaluation and recommendation of the most comprehensive knowledge base management tools in the whole network: flowus, baklib, jiandaoyun, ones wiki, pingcode, seed, mebox, Yifang cloud,

OLED屏幕的使用

数据湖(八):Iceberg数据存储格式
![[diy] self designed Microsoft makecode arcade, official open source software and hardware](/img/a3/999c1d38491870c46f380c824ee8e7.png)
[diy] self designed Microsoft makecode arcade, official open source software and hardware

Gui Gui programming (XIII) - event handling
随机推荐
7. Data permission annotation
过程化sql在定义变量上与c语言中的变量定义有什么区别
Swagger UI教程 API 文档神器
R語言可視化兩個以上的分類(類別)變量之間的關系、使用vcd包中的Mosaic函數創建馬賽克圖( Mosaic plots)、分別可視化兩個、三個、四個分類變量的關系的馬賽克圖
'class file has wrong version 52.0, should be 50.0' - class file has wrong version 52.0, should be 50.0
硬件开发笔记(十): 硬件开发基本流程,制作一个USB转RS232的模块(九):创建CH340G/MAX232封装库sop-16并关联原理图元器件
[weekly pit] information encryption + [answer] positive integer factorization prime factor
拼多多败诉,砍价始终差0.9%一案宣判;微信内测同一手机号可注册两个账号功能;2022年度菲尔兹奖公布|极客头条
Variable star --- article module (1)
PHP online examination system version 4.0 source code computer + mobile terminal
电子游戏的核心原理
防火墙基础之外网服务器区部署和双机热备
【DSP】【第一篇】开始DSP学习
New database, multidimensional table platform inventory note, flowus, airtable, seatable, Vig table Vika, Feishu multidimensional table, heipayun, Zhixin information, YuQue
Mécanisme de fonctionnement et de mise à jour de [Widget Wechat]
如何实现常见框架
Intel 48 core new Xeon run point exposure: unexpected results against AMD zen3 in 3D cache
性能测试过程和计划
知识图谱之实体对齐二
Summary of different configurations of PHP Xdebug 3 and xdebug2