当前位置:网站首页>YOLOV3学习笔记
YOLOV3学习笔记
2022-07-03 06:05:00 【开心的饲养员】
目录
1. 更先进的特征提取网络
YOLOV3相比YOLOV2其主体的特征提取网络变大了点,我想这也是其mAP提升的原因。YOLOV2的backbone使用了darknet19基础网络,darknet19即有9个卷积层,YOLOV3则使用了一种新的特征提取网络——darknet53,顾名思义有53个卷积层,论文中提到了darknet53的具体计算量,180.7亿次浮点计算,而上篇文章《YOLOV2学习笔记》中我们学习了darknet19只有70亿左右的浮点计算量,显然计算量多了很多,但相比于其提升的精度,这点计算量不算什么。除了网络架构更大了点,在darknet53中还创新的提出了residual操作。
darknet53网络的分类性能与resnet101,resnet152相比其网络结构对GPU的利用更加高效,如图2可以看出,虽然53的计算量是resset152的2/3,但其推理速度是resnet152的两倍,与计算量相近的热水net101相比,推理速度是他的1.5倍,这充分说明了darknet53网络结构的优越性,对GPU的利用更高效。在图2基础网络对比图中显示了darknet53每秒钟计算的浮点运算最多,(Billion Floating Point/Second)BFLOP/S值达到了1457。
图1 daknet53网络
图2 base网络性能对比
2. 位置检测原理
关于目标边界框的预测,在下图所示的anchor框中,如果anchor矩形框被检测的目标完全包含,则在边界框回归中参数设置为1,如果anchor矩形框只覆盖了目标的一部分,这里设置阈值为0.5,覆盖的部分面积小于anchor矩形框的一半,则该anchor矩形框将不计入损失函数中计算loss,如果覆盖面积大于anchor矩形框的一半,则将anchor矩形框记入损失函数中计算loss。该阈值在后面作者说明了,如果阈值设置为0.5时,YOLOV3的性能也是最好的。文中也提到,当该阈值增加时,YOLOV3的性能也会显著下降,另外YOLOV3目标检测网络使用了多尺度训练和推理,对小目标检测的准确度比YOLO提升了很多,但是对中等及大目标的准确率相对要差一点。
多尺度训练推理:在anchor box预测中引入特征金字塔网络,在darknet的yolov3.cfg文件中,可以看到,其yolo层的输出有三个,这三个yolo层输出的特征图尺度大小都不一样,不同尺度的特征图其描述的特征抽象程度不同,尺度越小特征越抽象越精细,尺度越大所描述的特征越粗糙。作者将这三个尺度的特征图使用了几个卷积层进行处理组合并输出,更好了利用了图像的粗细特征,使得预测更加精细。
3个yolo层的输出,且每层预测三个anchor box,即需要9个anchor值,使用K值聚类算法在coco数据集上聚类得到的9个anchor值为(10,13)(16,30) (33,23) (30 61) (62 45) (59 119) (116 90) (156 198) (373 326),即为现在yolov3.cfg文件中anchor值。
边栏推荐
- Merge and migrate data from small data volume, sub database and sub table Mysql to tidb
- tabbar的设置
- Convolution operation in convolution neural network CNN
- Skywalking8.7 source code analysis (II): Custom agent, service loading, witness component version identification, transform workflow
- Intel's new GPU patent shows that its graphics card products will use MCM Packaging Technology
- 从 Amazon Aurora 迁移数据到 TiDB
- When PHP uses env to obtain file parameters, it gets strings
- Oauth2.0 - Introduction and use and explanation of authorization code mode
- Clickhouse learning notes (I): Clickhouse installation, data type, table engine, SQL operation
- [teacher Zhao Yuqiang] index in mongodb (Part 2)
猜你喜欢
Kubernetes notes (VIII) kubernetes security
GPS坐标转百度地图坐标的方法
Cesium Click to obtain the longitude and latitude elevation coordinates (3D coordinates) of the model surface
Tabbar settings
Oauth2.0 - user defined mode authorization - SMS verification code login
Zhiniu stock project -- 05
使用conda创建自己的深度学习环境
[video of Teacher Zhao Yuqiang's speech on wot] redis high performance cache and persistence
有意思的鼠标指针交互探究
Clickhouse learning notes (2): execution plan, table creation optimization, syntax optimization rules, query optimization, data consistency
随机推荐
Some thoughts on machine learning
从 Amazon Aurora 迁移数据到 TiDB
GPS坐标转百度地图坐标的方法
PMP notes
Oauth2.0 - Introduction and use and explanation of authorization code mode
Get a screenshot of a uiscrollview, including off screen parts
理解 期望(均值/估计值)和方差
輕松上手Fluentd,結合 Rainbond 插件市場,日志收集更快捷
Kubernetes notes (10) kubernetes Monitoring & debugging
CKA certification notes - CKA certification experience post
有意思的鼠标指针交互探究
智牛股--03
Oauth2.0 - use database to store client information and authorization code
项目总结--01(接口的增删改查;多线程的使用)
Phpstudy setting items can be accessed by other computers on the LAN
Jackson: what if there is a lack of property- Jackson: What happens if a property is missing?
Merge and migrate data from small data volume, sub database and sub table Mysql to tidb
Kubernetes notes (VII) kuberetes scheduling
Cesium Click to obtain the longitude and latitude elevation coordinates (3D coordinates) of the model surface
When PHP uses env to obtain file parameters, it gets strings