当前位置:网站首页>YOLOv7——论文简述
YOLOv7——论文简述
2022-07-22 19:05:00 【gongyuandaye】
一、摘要
可以看到YOLOv7在速度和准确度上较之前的检测器有非常明显的提升。
作者提出了一种新的实时目标检测架构,针对解决重参数化模块的替换和动态标签分配问题,提出可训练的bag-of-freebies方法来提高准确度。
(1)更好地适配移动端
(2)关注训练过程的优化,而不增加推理成本
(3)planned re-parameterized model,用梯度传播路径的概念分析了适用于不同网络中layers的模型重参数化
(4)coarse-to-fine lead guided label assignment 由粗到细,针对不同输出层分配动态标签
二、模型
2.1 E-ELAN

使用扩展的ELAN,不破坏原有梯度路径的情况下不断增强网络学习能力的能力。
2.2 模型缩放

三、可训练的bag-of-freebies
3.1 重参数化

简单堆叠RepConv是可行的,如果要加残差,那么RepConv中的identity连接就会破环残差结构,所以去掉了identity;
下图展示了RepVGG在训练时,使用(B)多分支模型,而推理时转化成类似VGG的单路模型(快速且节省内存)。重参数化的目的就是对卷积自身或者和bn之间的融合。可以参考RepVGG论文中的计算过程。
3.2 辅助头检测

标签分配通常指gt,并根据给定的规则生成hard label。然而如果以目标检测为例,研究者经常利用网络预测输出的质量和分布,然后结合gt考虑使用一些计算和优化方法来生成可靠的软标签。例如,YOLO使用边界框回归和gt的IoU作为软标签。
本文使用aux head和lead head,在目标检测中aux head 关注recall的优化,对于lead head的输出,可以从aux head中精准的筛选出来。还没看代码,参考这篇简单总结一下:
①lead head中每个anchor与gt box如果匹配上(假设对某个gt box而言,其实只要gt box满足在某个anchor宽和高的0.25倍和4.0倍之间就算匹配成功),分配3个正样本,而aux head分配5个;其实就是简单的样本扩充,lead head和yolo v5一样的方法扩充,aux则是gt中心对应cell和相邻的4个cell。
②lead head中将top10样本iou求和取整,而aux head中取top 20。
aux head loss 和 lead head loss 按照0.25 : 1的比例进行融合。
四、实验
等看过代码再补
边栏推荐
- 在 MySQL 中使用枚举的陷阱一定要注意!
- SFM与MVS区别
- 1、强化学习基础总结
- 第九章 使用图像数据
- Codeforces Round #800 (Div. 2) C(前缀和+贪心) D(树DFS+贪心) lca+字典树复习
- Liu Jingjuan, Deputy Secretary General of the open atom open source foundation: Thoughts on the current situation and trend of open source development in China
- R language dynamic bubble chart
- 第零章 Encog入门介绍
- Tan Zhongyi, the initiator of xingce community: promote the intelligent transformation of enterprises by means of open source
- I used fluent deskstop to build a Mars xlog log parsing tool
猜你喜欢

第七章 其他神经网络类型

1. Summary of strengthening learning foundation

Dao smart contract DAPP system development technology

Real time face detection using mediapipe and opencv

MGRE与OSPF综合实验

Test how to use Fiddler to connect the mobile packet capturing app

Zhongang Mining: fluorite is rich in color and has great aesthetic value

Thread类中run和start的区别

(ROS_Melodic) 使用Rviz进行Boundingbox可视化

第六章 更多监督训练
随机推荐
使用mediapipe和OpenCV 实现简单人脸检测
Beautification of lasso regression results
JS 复杂数据类型
第九章 使用图像数据
Selenium error reporting solution
OWA email system login two factor authentication (SMS authentication) scheme
数仓:流批一体的探索与实践
R language rendering space visualization
ABAP ALV步骤
第三章 Encog Workbench
R language dynamic bubble chart
Codeforces Round #808 (Div. 2) C,D Codeforces Round #809 (Div. 2) C
urllib下载(urlretrieve())
Apifox学习记录
在 MySQL 中使用枚举的陷阱一定要注意!
Wang Huaimin, academician of the Chinese Academy of Sciences: thinking and practice of promoting China's open source innovation Consortium
7.20 Codeforces Round #763 (Div. 2) C(二分) D(数学期望)背包+树形dp复习
Website disable F12 prohibit debugging code method
IDEA DEBUG启动一直卡着不动解决办法
第五章 传播训练