当前位置:网站首页>【网易云信】超分辨率技术在实时音视频领域的研究与实践
【网易云信】超分辨率技术在实时音视频领域的研究与实践
2022-07-05 15:26:00 【InfoQ】
前言


超分辨率技术概述

超分辨率技术的分类与发展方向

传统超分辨率重建算法
- 基于插值的超分辨率重建:基于插值的方法将图像上每个像素都看做是图像平面上的一个点,那么对超分辨率图像的估计可以看做是利用已知的像素信息为平面上未知的像素信息进行拟合的过程,这通常由一个预定义的变换函数或者插值核来完成。基于插值的方法计算简单、易于理解,但存在较为明显的缺陷。复原出的图像常常出现模糊、锯齿等现象。常见的基于插值的方法包括最近邻插值法、双线性插值法和双立方插值法等。
- 基于退化模型的超分辨率重建:此类方法从图像的降质退化模型出发,假定高分辨率图像是经过了适当的运动变换、模糊及噪声才得到低分辨率图像。这种方法通过提取低分辨率图像中的关键信息,并结合对未知的超分辨率图像的先验知识来约束超分辨率图像的生成。常见的方法包括迭代反投影法、凸集投影法和最大后验概率法等。
- 基于学习的超分辨率重建:基于学习的方法则是利用大量的训练数据,从中学习低分辨率图像和高分辨率图像之间某种对应关系,然后根据学习到的映射关系来预测低分辨率图像所对应的高分辨率图像,从而实现图像的超分辨率重建过程。常见的基于学习的方法包括流形学习、稀疏编码方法。
基于深度学习的超分辨率重建算法
实时视频超分辨率的挑战
- 主观效果不佳,直接使用以上提到的基于深度学习的超分辨率算法,会发现其主观效果和 Bicubic 等传统算法差不多,对视频画质的提升效果很有限。
- 学界 SOTA 方法网络模型参数量过大,即使以轻便称的诸多网络,参数量也都大于 500K,这就导致模型运算量过大,推理很慢,无法满足移动端实时处理视频的要求。
云信 AI 超分
基于真实下采样的训练数据

云信超分辨率算法



- 模型压缩:在实际落地过程中,为了满足实时处理的要求,我们在CVPR NTIRE 2022 高效率超分挑战赛参赛模型-一种面向边缘的高效特征蒸馏模块(EFDN)的基础上,利用通道剪枝,知识蒸馏等模型压缩技术在优化后的模型架构上进一步减少模型中冗余的参数,去掉对模型性能贡献小的通道,达到减小模型复杂度的目的。同时采用量化技术将权重以低比特存储,从而减小模型体积,加速计算。
- 工程优化:在移动设备算力、内存带宽有限的情况下,既要满足超分算法实时处理视频的要求,又不能增加太多耗电,对工程化部署要求非常高。我们在工程侧的优化主要通过 SIMD,模型内存优化,数据排布优化等优化方法节省内存开销以及推理耗时,同时深度结合业务场景实现算法在渲染管线与设备之间内存零拷贝,完成了算法的高性能落地。

效果展示与未来展望
- 提升视频清晰度,利用高端机屏幕的高分辨率优势,低清视频高清播放,高清视频提供超高清画质,提升用户视频消费体验。
- 降低带宽,通过发送端/服务端降低转码分发视频分辨率,结合接收端超分处理呈现高分辨率效果,降低高清播放门槛,提升流畅度,减轻用户网络压力。

边栏推荐
- Bugku easy_ nbt
- MySQL overview
- 如何将 DevSecOps 引入企业?
- Advanced level of static and extern
- Clock switching with multiple relationship
- 定义严苛标准,英特尔Evo 3.0正在加速PC产业升级
- 18.[STM32]读取DS18B20温度传感器的ROM并实现多点测量温度
- 20. [stm32] realize the function of intelligent garbage can by using ultrasonic module and steering gear
- Data communication foundation - routing communication between VLANs
- Defining strict standards, Intel Evo 3.0 is accelerating the upgrading of the PC industry
猜你喜欢
![17.[STM32]仅用三根线带你驱动LCD1602液晶](/img/c6/b56c54da2553a451b526179f8b5867.png)
17.[STM32]仅用三根线带你驱动LCD1602液晶

Summary of the third class

Example project: simple hexapod Walker

OSI 七层模型

vlunhub- BoredHackerBlog Moriarty Corp

Lesson 4 knowledge summary
![19.[STM32]HC_ SR04 ultrasonic ranging_ Timer mode (OLED display)](/img/fe/8f59db28823290da8e9280df06673d.jpg)
19.[STM32]HC_ SR04 ultrasonic ranging_ Timer mode (OLED display)

SQL injection sqllabs (basic challenges) 11-20

Quick completion guide for manipulator (IX): forward kinematics analysis

Good article inventory
随机推荐
Anti shake and throttling
Interval DP (gravel consolidation)
17. [stm32] use only three wires to drive LCD1602 LCD
How difficult is it to pass the certification of Intel Evo 3.0? Yilian technology tells you
Good article inventory
21.[STM32]I2C协议弄不懂,深挖时序图带你编写底层驱动
Six common transaction solutions, you sing, I come on stage (no best, only better)
MySQL表字段调整
17.[STM32]仅用三根线带你驱动LCD1602液晶
20.[STM32]利用超声波模块和舵机实现智能垃圾桶功能
wxml2canvas
sql中查询最近一条记录
示例项目:简单的六足步行者
obj解析为集合
The computer is busy, and the update is a little slow
Arduino controls a tiny hexapod 3D printing robot
Clock switching with multiple relationship
JS topic - console log()
Bugku telnet
Install PHP extension spoole