当前位置:网站首页>基于深度学习的参考帧生成
基于深度学习的参考帧生成
2022-07-06 12:46:00 【Dillon2015】
本文来自提案JVET-T0058和JVET-U0087,该方法通过插帧的方法生成虚拟参考帧用于帧间预测。整个模型由几个子模型组成,分别进行光流估计、补偿和细节增强。
整体架构
整体架构如Fig.1所示,在视频编码过程中DPB中存着用于运动估计的参考帧,根据GOP结构当前帧有一个或多个前向、后向参考帧。提案中默认使用POC距离当前帧最近的两个参考帧生成虚拟参考帧,如Fig.1中当前帧POC是5,则使用POC为4和6的帧生成参考帧。生成的虚拟参考帧会被放入DPB用于参考,虚拟参考帧的POC设置为和当前帧相同。为了防止影响时域MVP中根据POC距离的MV缩放过程,虚拟参考帧的MV都设为0且被用作长期参考帧。在提案中,当前帧解码完成后虚拟参考帧就从DPB中移除。
对于高分辨率序列(4K或8K)由于资源受限不能对整帧直接使用神经网络处理,此时假设虚拟参考帧被分为多个区域,每个区域单独使用网络生成,然后将这些区域拼成参考帧。
网络模型
一般的视频插帧大都利用了光流估计和补偿,一般使用双向光流方法,然后通过一个线性模型将两个光流合成一个。提案中仅使用单光流模型。
如Fig.2,首先通过光流估计模型生成光流(输入为POC距离最近的两个参考帧),然后通过backward warping过程处理光流,处理后的光流和两个参考帧再通过fusion过程合成中间帧。中间帧会通过细节增强模型提升质量,细节增强模型包含两部分,PCD(Pyramid, Cascading and Deformable)用于时空优化和TSA (Temporal and Spatial Attention)用于提高重要特征的attention。
实验结果
感兴趣的请关注微信公众号Video Coding
边栏推荐
- OLED屏幕的使用
- “罚点球”小游戏
- SAP UI5 框架的 manifest.json
- Statistical inference: maximum likelihood estimation, Bayesian estimation and variance deviation decomposition
- Can novices speculate in stocks for 200 yuan? Is the securities account given by qiniu safe?
- OLED屏幕的使用
- Entity alignment two of knowledge map
- User defined current limiting annotation
- Comprehensive evaluation and recommendation of the most comprehensive knowledge base management tools in the whole network: flowus, baklib, jiandaoyun, ones wiki, pingcode, seed, mebox, Yifang cloud,
- Web开发小妙招:巧用ThreadLocal规避层层传值
猜你喜欢
面试官:Redis中有序集合的内部实现方式是什么?
[wechat applet] operation mechanism and update mechanism
Utilisation de l'écran OLED
Intel 48 core new Xeon run point exposure: unexpected results against AMD zen3 in 3D cache
Kubernetes learning summary (20) -- what is the relationship between kubernetes and microservices and containers?
小孩子學什麼編程?
Distributed ID
【mysql】触发器
2022 construction electrician (special type of construction work) free test questions and construction electrician (special type of construction work) certificate examination
Spark SQL chasing Wife Series (initial understanding)
随机推荐
Database - how to get familiar with hundreds of tables of the project -navicat these unique skills, have you got it? (exclusive experience)
【OpenCV 例程200篇】220.对图像进行马赛克处理
Taylor series fast Fourier transform (FFT)
Comment faire une radio personnalisée
Recyclerview GridLayout bisects the middle blank area
7、数据权限注解
Web开发小妙招:巧用ThreadLocal规避层层传值
基于STM32单片机设计的红外测温仪(带人脸检测)
小孩子学什么编程?
Intel 48 core new Xeon run point exposure: unexpected results against AMD zen3 in 3D cache
Intel 48 core new Xeon run point exposure: unexpected results against AMD zen3 in 3D cache
[DIY]如何制作一款個性的收音機
2022 construction electrician (special type of construction work) free test questions and construction electrician (special type of construction work) certificate examination
快过年了,心也懒了
Application layer of tcp/ip protocol cluster
SSO single sign on
1_ Introduction to go language
[DSP] [Part 2] understand c6678 and create project
In line elements are transformed into block level elements, and display transformation and implicit transformation
Spark SQL chasing Wife Series (initial understanding)