当前位置:网站首页>基于Unet的环路滤波
基于Unet的环路滤波
2022-07-01 03:37:00 【Dillon2015】
本文来自大华在JVET工作组的提案JVET-Y0086《A Unet-Based Deep In-Loop Filter》
简介
由于DNN在图像去噪和细节还原上效果显著,如果用于视频编码的环路滤波环节则能更好的重建图像提高编码效率。提案提出了基于HDRUnet的环路滤波技术,其中HDRUnet是一种基于Unet的网络。
网络结构

图1 网络结构
图1是网络结构,对于亮度分量网络输入尺寸是160x160,在CTU尺寸128x128基础上每个方向往外填充16个像素,同时对应的色度块上采样到160x160作为输入。
处理色度时,网络输入尺寸是80x80,在色度CTU尺寸64x64基础上每个方向往外填充8个像素,同时对应的亮度块下采样到80x80作为输入。
亮度和色度分别训练不同的模型,其中两个色度分量共用一套模型参数。
该模型作用于环路滤波SAO之后,ALF之前。并且在SPS中通过标志位控制该工具的开启,同时帧级对亮度和色度分量分别有标志位表示是否开启。
训练和推导信息
对于不同QP={22,27,32,37,42}分别训练模型,所以亮度和色度各有5个模型。模型训练使用PyTorch框架,并使用Libtorch集成到VTM11.0_NNVC。
模型训练信息如表1,

模型推导信息如表2,

实验结果

在VTM11.0_NNVC上AI配置下,该方法Y、U、V的BD-Rate分别为 -6.08%、 -20.34%、 -21.13%
感兴趣的请关注微信公众号Video Coding

边栏推荐
- 4. [WebGIS practice] software operation chapter - data import and processing
- 168. Excel表列名称
- 【TA-霜狼_may-《百人计划》】1.2.2 矩阵计算
- 不同性能测试工具的并发模式
- [ta - Frost Wolf May - 100 people plan] 2.3 Introduction aux fonctions communes
- Pytorch training deep learning network settings CUDA specified GPU visible
- 互联网行业最佳产品开发流程 推荐!
- 241. 为运算表达式设计优先级
- 283.移动零
- 168. excel table column name
猜你喜欢

C语言的sem_t变量类型

IPv4 and IPv6, LAN and WAN, gateway, public IP and private IP, IP address, subnet mask, network segment, network number, host number, network address, host address, and IP segment / number - what does

283.移动零

Binary tree god level traversal: Morris traversal

【TA-霜狼_may-《百人计划》】1.2.1 向量基础

Grid system in bootstrap
![[ta - Frost Wolf May - 100 people plan] 2.3 Introduction aux fonctions communes](/img/be/325f78dee744138a865c13d2c20475.png)
[ta - Frost Wolf May - 100 people plan] 2.3 Introduction aux fonctions communes

复习专栏之---消息队列

[TA frost wolf _may - "hundred people plan"] 1.4 introduction to PC mobile phone graphics API
![[ta - Frost Wolf May - 100 people plan] 1.2.1 base vectorielle](/img/94/99090ea91082a385968e071ef3766c.png)
[ta - Frost Wolf May - 100 people plan] 1.2.1 base vectorielle
随机推荐
Usage of AfxMessageBox and MessageBox
Libevent Library Learning
Valentine's Day is nothing.
[EI search] important information conference of the 6th International Conference on materials engineering and advanced manufacturing technology (meamt 2022) in 2022 website: www.meamt Org meeting time
Pyramid scene parsing network [pspnet] thesis reading
205. isomorphic string
241. Design priorities for operational expressions
Appium自动化测试基础--补充:C/S架构和B/S架构说明
Error: plug ins declaring extensions or extension points must set the singleton directive to true
“目标检测“+“视觉理解“实现对输入图像的理解
【快捷键】
[EI conference] the Third International Conference on nanomaterials and nanotechnology in 2022 (nanomt 2022)
Unexpected token o in JSON at position 1, JSON parsing problem
谷粒学院微信扫码登录过程记录以及bug解决
【TA-霜狼_may-《百人计划》】1.1 渲染流水线
[party benefits] jsonobject to string, leave blank
程序员女友给我做了一个疲劳驾驶检测
25.K个一组翻转链表
Appium fundamentals of automated testing - basic principles of appium
SEM of C language_ Tvariable type