当前位置:网站首页>YOLO V3详解
YOLO V3详解
2022-07-30 20:00:00 【樱花的浪漫】
YOLO 第三版并没有特别突出的创新之处,主要是基于YOLO第二版进行了一些改进。
1.类别预测
一个目标可能具有多个类别标签,各个类别之间不一定是互斥的。比如,橘子也是一种水果,同时还是一种食物,对于这样的目标来说,几个类别标签都正确的。YOLO第三版采用logistic分类器(逻辑回归)代替了softmax分类器,在训练过程中,使用了交叉嫡损失。
本质上,YOLO第三版采用多个二分类器代替一对多分类器,实现了对一个目标多个类别标签的判定。
2.使用多尺度特征
YOLO第三版在特征图上的每个位置使用3个锚,在一个N×N大小的特征图上,需要预测的参数数量为NxN×3×(4+1+n _class),其中3表示3个锚,4表示4个坐标,1表示是否框中目标的置信度,n_class表示需要回归的类别概率。
为了使算法具备更好的多尺度检测能力,YOLO第三版借鉴了FPN的思想。假设第一个用于检测的特征图是网络的第n层,在网络较浅的位置取第m层,m<n,第m层的尺寸大于第n层的尺寸,具有更细节的特征表达能力,对第n层的特征图进行上采样,使得上采样后的特征图和第m层的特征图具有相同的尺寸,然后把第m层特征图和上采样后的特征图对齐位置“摞”在一起(进行concat操作,与FPN的elementwise add操作有所区别),构成第2个特征图。新的特征图融合了深层和浅层特征,具备更好的多尺度表达能力。利用类似的方法,可以选取更浅层的特征图构造第3个特征图。分别基于这3个特征图进行预测,能够得到更好的多尺度目标检测效果。
3.使用残差结构网络
YOLO第三版借鉴了ResNet结构,也设计了一个残差网络Darknet-53,如图所示,使得整个网络更容易训练。

论文还提到了一些实验
4. Things We Tried That Didn’t Work
我们在开发YOLOv3的时候尝试了很多东西。很多方法都不起作用。这是我们能记住的东西。
Anchor box x, y offset predictions. 我们尝试使用普通的锚盒预测机制,其中你使用线性激活来预测x,y偏移为盒子宽度或高度的倍数。我们发现这个公式降低了模型的稳定性,而且效果不是很好。
Linear x, y predictions instead of logistic. 我们尝试使用线性激活来直接预测x,y的偏移量,而不是逻辑激活。这导致了mAP值下降了几个百分点。
Focal loss. 我们尝试使用焦点损失。它使我们的mAP下降了大约2%。YOLOv3可能已经对焦点损失试图解决的问题具有鲁棒性,因为它有独立的客观性预测和条件类预测。因此,对于大多数例子来说,类别预测没有损失吗?还是什么?我们不太确定。


Dual IOU thresholds and truth assignment. Faster RCNN在训练过程中使用了两个IOU阈值。如果IOU>0.7,作为一个积极的例子,[0.3−0.7]它被忽略,对于IOU<0.3,这是一个消极的例子。我们尝试了类似的策略,但没有取得好的结果。
我们很喜欢我们目前的公式,它似乎至少是在一个局部最优的状态。这些技术中的一些最终可能会产生好的结果,也许它们只需要一些调整来稳定训练。
边栏推荐
- MySQL six-pulse sword, SQL customs clearance summary
- MySQL函数(经典收藏)
- iPhone真是十三香?两代产品完全对比,或许上一代更值得买
- Swift简介
- To the operation of the int variable assignment is atom?
- 推荐系统:实时性【特征实时性:客户端实时特征(秒级,实时)、流处理平台(分钟级,近实时)、分布式批处理平台(小时/天级,非实时)】【模型实时性:在线学习、增量更新、全量更新】
- 倾斜文档扫描与字符识别(opencv,坐标变换分析)
- 来了!东方甄选为龙江农产品直播带货
- Recommended system: cold start problem [user cold start, item cold start, system cold start]
- 4年测试经验去面试10分钟就被赶出来了,面试官说我还不如应届生?都这么卷吗...
猜你喜欢

MySQL数据库 ---MySQL表的增删改查(进阶)

Common Expression Recognition Based on Face (1) - Basic Knowledge of Deep Learning

Centos7 install mysql8
Database Tuning - Database Tuning

用jOOQ 3.17投射类型安全的嵌套表记录

“数字化重构系统,搞定 CEO 是第一步”

centos7安装mysql8

MySQL sub-database sub-table

MySQL database --- Addition, deletion, modification and query of MySQL tables (advanced)

MySql密码
随机推荐
Different lower_case_table_names settings for server (‘1‘) and data dictionary (‘0‘) 解决方案
推荐系统:实时性【特征实时性:客户端实时特征(秒级,实时)、流处理平台(分钟级,近实时)、分布式批处理平台(小时/天级,非实时)】【模型实时性:在线学习、增量更新、全量更新】
ELK日志分析系统
Linux download and install mysql5.7 version tutorial the most complete and detailed explanation
Difference Between Concurrency and Parallelism
网络层协议------IP协议
并发与并行的区别
The 17th "Revitalization Cup" National Youth Vocational Skills Competition - Computer Programmers (Cloud Computing Platform and Operation and Maintenance) Participation Review and Summary
阿里面试这些微服务还不会?那还是别去了,基本等通知
TensorFlow2:概述
Recommender systems: overview of the characteristics of architecture: user/item engineering -- -- -- -- -- -- -- -- > recall layer > sort layer - > test/evaluation 】 【 cold start problems, real-time 】
【请教】SQL语句按列1去重来计算列2之和?
Zabbix 5.0 监控教程(一)
Common Expression Recognition Based on Face (1) - Basic Knowledge of Deep Learning
MySQL八股文背诵版
PHP低代码开发平台 V5.0.7新版发布
用jOOQ 3.17投射类型安全的嵌套表记录
Recommendation system: evaluation index [offline evaluation index: RMSE (root mean square error), AUC, precision, recall, F1] [online evaluation: A/B test] [generally required response time <0.5s]
一文2500字手把手教你配置Jenkins自动化邮件通知
Install Mysql5.7 under Linux, super detailed and complete tutorial, and cloud mysql connection