当前位置:网站首页>目标检测-中篇
目标检测-中篇
2022-08-04 03:07:00 【Peyzhang】
YOLO
使用单个神经网络,在一次评估中直接从完整图像上预测边界框和类别概率。由于整个检测流程仅用一个网络,所以可以直接对检测性能进行端到端的优化。
YOLO结构: ---- GoogleNet + 4个卷积 + 2个全连接层
- 1、把图像缩放到448X448
- 2、在图上运行卷积网络
- 3、根据模型的置信度对检测结果进行阈值处理

单元格(cell)
7 x 7=49个像素值,理解成49个单元格,每个单元格可以代表原图的一个方块。单元格需要做的两件事:
- 每个边界框包含两个目标预测,每个目标包括5个预测值:x,y,w,h和置信度
- 每个单元格预测两个(默认)bbox位置,两个bbox置信度(confidence) : 7 x 7 x 2=98个bbox。30=(4+1+4+1+20), 4个坐标信息,1个置信度(confidence)代表一个bbox的结果, 20代表 20类的预测概率结果

一个网格会预测两个Bbox,在训练时我们只有一个Bbox专门负责(一个Object 一个Bbox)
20 个类别概率代表这个网络中的一个bbox
confidence
如果grid cell里面没有object,confidence就是0
如果有,则confidence score等于 预测的box和ground truth的IOU乘积,(每个cell 中两个bbox 都与真实值比较,确定最终的bbox)
训练损失
- 三部分损失 bbox损失+confidence损失+classfication损失
YOLO V2
针对YOLO算法,改进:(训练机制,网络改变–Darknet-19,k-means聚类算法对训练集中的边界框做了聚类分析,直接位置预测)
YOLO V3
改进:(网络Darknet-53,逻辑回归替代softmax作为分类器)
边栏推荐
- 一文看懂推荐系统:召回04:离散特征处理,one-hot编码和embedding特征嵌入
- Rongyun "Audio and Video Architecture Practice" technical session [complete PPT included]
- "Introduction to nlp + actual combat: Chapter 8: Using Pytorch to realize handwritten digit recognition"
- How to read the resources files in the directory path?
- 哎,又跟HR在小群吵了一架!
- Y86. Chapter iv Prometheus giant monitoring system and the actual combat, Prometheus storage (17)
- STM8S-----option byte
- In a more general sense, calculating the displacement distance and assumptions
- 千兆2光8电管理型工业以太网交换机WEB管理X-Ring一键环网交换机
- 【 observe 】 super fusion: the first mention of "calculate net nine order" evaluation model, build open prosperity of power network
猜你喜欢

How to drop all tables under database in MySQL
The general SQL injection flow (sample attached)

There are n steps in total, and you can go up to 1 or 2 steps each time. How many ways are there?
SQL注入中 #、 --+、 --%20、 %23是什么意思?

uni-app 从零开始-基础模版(一)

董明珠直播时冷脸离场,员工频犯低级错误,自家产品没人能弄明白

Brush esp8266-01 s firmware steps

【指针内功修炼】深度剖析指针笔试题(三)

Polygon zkEVM网络节点

y86.第四章 Prometheus大厂监控体系及实战 -- prometheus存储(十七)
随机推荐
In a more general sense, calculating the displacement distance and assumptions
STM8S105k4t6c--------------点亮LED
用户与用户互发红包/支付宝C2C/B2C现金红包php源码示例/H5方式/兼容苹果/安卓
2022年最新海南建筑八大员(材料员)模拟考试试题及答案
MRS: Alluxio的使用介绍
怎样提高网络数据安全性
Returns the maximum number of palindromes in a string
4-way two-way HDMI integrated business high-definition video optical transceiver 8-way HDMI high-definition video optical transceiver
Mockito单元测试
Power button (LeetCode) 215. The first K largest elements in the array (2022.08.03)
[QNX Hypervisor 2.2 User Manual] 10.3 vdev gic
【源码】使用深度学习训练一个游戏
Detailed analysis of scaffolding content
y86.第四章 Prometheus大厂监控体系及实战 -- prometheus存储(十七)
各位大佬好,麻烦问一下flink cdc oracle写入doris的时候,发现cpu异常,一下下跑
融云「音视频架构实践」技术专场【内含完整PPT】
Based on the statistical QDirStat Qt directory
golang中的unsafe.Pointer,指针,引用
网络工程师入门必懂华为认证体系,附系统学习路线分享
docker+网桥+redis主从+哨兵模式