当前位置:网站首页>YOLO V3详解
YOLO V3详解
2022-07-30 20:00:00 【樱花的浪漫】
YOLO 第三版并没有特别突出的创新之处,主要是基于YOLO第二版进行了一些改进。
1.类别预测
一个目标可能具有多个类别标签,各个类别之间不一定是互斥的。比如,橘子也是一种水果,同时还是一种食物,对于这样的目标来说,几个类别标签都正确的。YOLO第三版采用logistic分类器(逻辑回归)代替了softmax分类器,在训练过程中,使用了交叉嫡损失。
本质上,YOLO第三版采用多个二分类器代替一对多分类器,实现了对一个目标多个类别标签的判定。
2.使用多尺度特征
YOLO第三版在特征图上的每个位置使用3个锚,在一个N×N大小的特征图上,需要预测的参数数量为NxN×3×(4+1+n _class),其中3表示3个锚,4表示4个坐标,1表示是否框中目标的置信度,n_class表示需要回归的类别概率。
为了使算法具备更好的多尺度检测能力,YOLO第三版借鉴了FPN的思想。假设第一个用于检测的特征图是网络的第n层,在网络较浅的位置取第m层,m<n,第m层的尺寸大于第n层的尺寸,具有更细节的特征表达能力,对第n层的特征图进行上采样,使得上采样后的特征图和第m层的特征图具有相同的尺寸,然后把第m层特征图和上采样后的特征图对齐位置“摞”在一起(进行concat操作,与FPN的elementwise add操作有所区别),构成第2个特征图。新的特征图融合了深层和浅层特征,具备更好的多尺度表达能力。利用类似的方法,可以选取更浅层的特征图构造第3个特征图。分别基于这3个特征图进行预测,能够得到更好的多尺度目标检测效果。
3.使用残差结构网络
YOLO第三版借鉴了ResNet结构,也设计了一个残差网络Darknet-53,如图所示,使得整个网络更容易训练。

论文还提到了一些实验
4. Things We Tried That Didn’t Work
我们在开发YOLOv3的时候尝试了很多东西。很多方法都不起作用。这是我们能记住的东西。
Anchor box x, y offset predictions. 我们尝试使用普通的锚盒预测机制,其中你使用线性激活来预测x,y偏移为盒子宽度或高度的倍数。我们发现这个公式降低了模型的稳定性,而且效果不是很好。
Linear x, y predictions instead of logistic. 我们尝试使用线性激活来直接预测x,y的偏移量,而不是逻辑激活。这导致了mAP值下降了几个百分点。
Focal loss. 我们尝试使用焦点损失。它使我们的mAP下降了大约2%。YOLOv3可能已经对焦点损失试图解决的问题具有鲁棒性,因为它有独立的客观性预测和条件类预测。因此,对于大多数例子来说,类别预测没有损失吗?还是什么?我们不太确定。


Dual IOU thresholds and truth assignment. Faster RCNN在训练过程中使用了两个IOU阈值。如果IOU>0.7,作为一个积极的例子,[0.3−0.7]它被忽略,对于IOU<0.3,这是一个消极的例子。我们尝试了类似的策略,但没有取得好的结果。
我们很喜欢我们目前的公式,它似乎至少是在一个局部最优的状态。这些技术中的一些最终可能会产生好的结果,也许它们只需要一些调整来稳定训练。
边栏推荐
猜你喜欢

win2003下FTP服务器如何搭建

Database indexes: indexes are not a panacea
Typora设置标题自动标号

How to install and use PostgreSQL 14.4

360杜跃进:太空安全风险加剧,需打造一体化防御体系

Face-based Common Expression Recognition (2) - Data Acquisition and Arrangement

MySQL database - views and indexes

PostgreSQL 14.4如何安装使用

The JDBC programming of the MySQL database

MySQL数据库————视图和索引
随机推荐
【PM专用】快速统计团队还有谁没有登记上报信息,快速筛选出属于自己项目组的成员,未完成XXX工作事项的名单
Install MySQL tutorial under Linux
MySQL slow query optimization
KEIL问题:【keil Error: failed to execute ‘C:\Keil\ARM\ARMCC‘】
360杜跃进:太空安全风险加剧,需打造一体化防御体系
网络层协议------IP协议
Database Tuning - Database Tuning
MySQL复制表结构、表数据的方法
明解C语言第六章习题
对int变量赋值的操作是原子的吗?
MySQl数据库————DQL数据查询语言
Recommender systems: overview of the characteristics of architecture: user/item engineering -- -- -- -- -- -- -- -- > recall layer > sort layer - > test/evaluation 】 【 cold start problems, real-time 】
【Node实现数据加密】
ImportError:attempted relative import with no known parent package
iPhone真是十三香?两代产品完全对比,或许上一代更值得买
el-input 只能输入整数(包括正数、负数、0)或者只能输入整数(包括正数、负数、0)和小数
Linux下最新版MySQL 8.0的下载与安装(详细步骤)
【flink】报错整理 Could not instantiate the executor. Make sure a planner module is on the classpath
Zabbix 5.0 监控教程(一)
LeetCode 0952. Calculate Maximum Component Size by Common Factor: Mapping / Union Search