当前位置:网站首页>YOLO V3详解
YOLO V3详解
2022-07-30 20:00:00 【樱花的浪漫】
YOLO 第三版并没有特别突出的创新之处,主要是基于YOLO第二版进行了一些改进。
1.类别预测
一个目标可能具有多个类别标签,各个类别之间不一定是互斥的。比如,橘子也是一种水果,同时还是一种食物,对于这样的目标来说,几个类别标签都正确的。YOLO第三版采用logistic分类器(逻辑回归)代替了softmax分类器,在训练过程中,使用了交叉嫡损失。
本质上,YOLO第三版采用多个二分类器代替一对多分类器,实现了对一个目标多个类别标签的判定。
2.使用多尺度特征
YOLO第三版在特征图上的每个位置使用3个锚,在一个N×N大小的特征图上,需要预测的参数数量为NxN×3×(4+1+n _class),其中3表示3个锚,4表示4个坐标,1表示是否框中目标的置信度,n_class表示需要回归的类别概率。
为了使算法具备更好的多尺度检测能力,YOLO第三版借鉴了FPN的思想。假设第一个用于检测的特征图是网络的第n层,在网络较浅的位置取第m层,m<n,第m层的尺寸大于第n层的尺寸,具有更细节的特征表达能力,对第n层的特征图进行上采样,使得上采样后的特征图和第m层的特征图具有相同的尺寸,然后把第m层特征图和上采样后的特征图对齐位置“摞”在一起(进行concat操作,与FPN的elementwise add操作有所区别),构成第2个特征图。新的特征图融合了深层和浅层特征,具备更好的多尺度表达能力。利用类似的方法,可以选取更浅层的特征图构造第3个特征图。分别基于这3个特征图进行预测,能够得到更好的多尺度目标检测效果。
3.使用残差结构网络
YOLO第三版借鉴了ResNet结构,也设计了一个残差网络Darknet-53,如图所示,使得整个网络更容易训练。

论文还提到了一些实验
4. Things We Tried That Didn’t Work
我们在开发YOLOv3的时候尝试了很多东西。很多方法都不起作用。这是我们能记住的东西。
Anchor box x, y offset predictions. 我们尝试使用普通的锚盒预测机制,其中你使用线性激活来预测x,y偏移为盒子宽度或高度的倍数。我们发现这个公式降低了模型的稳定性,而且效果不是很好。
Linear x, y predictions instead of logistic. 我们尝试使用线性激活来直接预测x,y的偏移量,而不是逻辑激活。这导致了mAP值下降了几个百分点。
Focal loss. 我们尝试使用焦点损失。它使我们的mAP下降了大约2%。YOLOv3可能已经对焦点损失试图解决的问题具有鲁棒性,因为它有独立的客观性预测和条件类预测。因此,对于大多数例子来说,类别预测没有损失吗?还是什么?我们不太确定。


Dual IOU thresholds and truth assignment. Faster RCNN在训练过程中使用了两个IOU阈值。如果IOU>0.7,作为一个积极的例子,[0.3−0.7]它被忽略,对于IOU<0.3,这是一个消极的例子。我们尝试了类似的策略,但没有取得好的结果。
我们很喜欢我们目前的公式,它似乎至少是在一个局部最优的状态。这些技术中的一些最终可能会产生好的结果,也许它们只需要一些调整来稳定训练。
边栏推荐
- To the operation of the int variable assignment is atom?
- Recommender systems: overview of the characteristics of architecture: user/item engineering -- -- -- -- -- -- -- -- > recall layer > sort layer - > test/evaluation 】 【 cold start problems, real-time 】
- Weak Banks to data conversion ability?Matt software help solve bank dilemma
- MySQL数据库 ---MySQL表的增删改查(进阶)
- 基于人脸的常见表情识别(2)——数据获取与整理
- Linux下安装Mysql5.7,超详细完整教程,以及云mysql连接
- MySQL六脉神剑,SQL通关大总结
- MySQL八股文背诵版
- 360杜跃进:太空安全风险加剧,需打造一体化防御体系
- Niuke.com - Huawei Question Bank (100~108)
猜你喜欢

How to install and use PostgreSQL 14.4

MySQL数据库主从配置

360杜跃进:太空安全风险加剧,需打造一体化防御体系

TensorFlow2: Overview

MySQL performance optimization (hardware, system configuration, table structure, SQL statements)

MySQL Functions (Classic Collection)

Maxwell 一款简单易上手的实时抓取Mysql数据的软件

coming!Dongfang Selection brings goods to the live broadcast of Longjiang agricultural products

MySQL mass production of data

KEIL问题:【keil Error: failed to execute ‘C:\Keil\ARM\ARMCC‘】
随机推荐
Linux下安装MySQL教程
MySQL六脉神剑,SQL通关大总结
从离线到实时对客,湖仓一体释放全量数据价值
HCIP --- 企业网的三层架构
Based on the face of the common expression recognition - model building, training and testing
M3SDA: Moment matching for multi-source domain adaptation
Mapped Statements collection does not contain value for的解决方法
Day31 LeetCode
MySQL复制表结构、表数据的方法
Zabbix 5.0 Monitoring Tutorial (1)
[c语言]二维数组动态分配内存
el-input can only input integers (including positive numbers, negative numbers, 0) or only integers (including positive numbers, negative numbers, 0) and decimals
Download Win11 how to change the default path?Download Win11 change the default path method
Recommendation system: evaluation index [offline evaluation index: RMSE (root mean square error), AUC, precision, recall, F1] [online evaluation: A/B test] [generally required response time <0.5s]
The JDBC programming of the MySQL database
MySQL数据库————视图和索引
ELK日志分析系统
湖仓一体电商项目(四):项目数据种类与采集
ImportError:attempted relative import with no known parent package
明解C语言第六章习题