当前位置:网站首页>目标检测-中篇
目标检测-中篇
2022-08-04 03:07:00 【Peyzhang】
YOLO
使用单个神经网络,在一次评估中直接从完整图像上预测边界框和类别概率。由于整个检测流程仅用一个网络,所以可以直接对检测性能进行端到端的优化。
YOLO结构: ---- GoogleNet + 4个卷积 + 2个全连接层
- 1、把图像缩放到448X448
- 2、在图上运行卷积网络
- 3、根据模型的置信度对检测结果进行阈值处理
单元格(cell)
7 x 7=49个像素值,理解成49个单元格,每个单元格可以代表原图的一个方块。单元格需要做的两件事:
- 每个边界框包含两个目标预测,每个目标包括5个预测值:x,y,w,h和置信度
- 每个单元格预测两个(默认)bbox位置,两个bbox置信度(confidence) : 7 x 7 x 2=98个bbox。30=(4+1+4+1+20), 4个坐标信息,1个置信度(confidence)代表一个bbox的结果, 20代表 20类的预测概率结果
一个网格会预测两个Bbox,在训练时我们只有一个Bbox专门负责(一个Object 一个Bbox)
20 个类别概率代表这个网络中的一个bbox
confidence
如果grid cell里面没有object,confidence就是0
如果有,则confidence score等于 预测的box和ground truth的IOU乘积,(每个cell 中两个bbox 都与真实值比较,确定最终的bbox)
训练损失
- 三部分损失 bbox损失+confidence损失+classfication损失
YOLO V2
针对YOLO算法,改进:(训练机制,网络改变–Darknet-19,k-means聚类算法对训练集中的边界框做了聚类分析,直接位置预测)
YOLO V3
改进:(网络Darknet-53,逻辑回归替代softmax作为分类器)
边栏推荐
- 倒计时2天,“文化数字化战略新型基础设施暨文化艺术链生态建设发布会”启幕在即
- Mockito单元测试
- 哎,又跟HR在小群吵了一架!
- How to drop all tables under database in MySQL
- kingbaseES V8R2/R3 表在指定表空间,为何显示为默认表空间?
- 【指针内功修炼】深度剖析指针笔试题(三)
- How many ways do you know about communication between multiple threads?
- In the season of going overseas, the localization of Internet tips for going overseas
- STM8S105k4t6c--------------点亮LED
- 三分建设,七分管理!产品、系统、组织三管齐下节能降耗
猜你喜欢
STM8S105K4T6------Serial port sending and receiving
There are too many systems, how to realize multi-account interworking?
"Introduction to nlp + actual combat: Chapter 8: Using Pytorch to realize handwritten digit recognition"
【源码】使用深度学习训练一个游戏
Rongyun "Audio and Video Architecture Practice" technical session [complete PPT included]
y86.第四章 Prometheus大厂监控体系及实战 -- prometheus存储(十七)
Y86. Chapter iv Prometheus giant monitoring system and the actual combat, Prometheus storage (17)
pytorch applied to MNIST handwritten font recognition
Flink原理流程图简单记录
STM8S project creation (STVD creation) --- use COSMIC to create a C language project
随机推荐
SSLHandshakeException: No appropriate protocol (protocol is disabled or cipher suites are inappropri
sqoop ETL tool
MySQL 查询练习(1)
Power button (LeetCode) 215. The first K largest elements in the array (2022.08.03)
kingbaseES V8R2/R3 表在指定表空间,为何显示为默认表空间?
哎,又跟HR在小群吵了一架!
QNX Hypervisor] 10.2 vdev 8259 2.2 user manual
Returns the maximum number of palindromes in a string
FPGA解析B码----连载3
DIY电工维修如何拆卸和安装开关面板插座
三分建设,七分管理!产品、系统、组织三管齐下节能降耗
docker+bridge+redis master-slave+sentry mode
TOML configuration file format, YAML's top contender
数据安全峰会2022 | 美创DSM获颁“数据安全产品能力验证计划”评测证书
Y86. Chapter iv Prometheus giant monitoring system and the actual combat, Prometheus storage (17)
pnpm 是凭什么对 npm 和 yarn 降维打击的
2022支付宝C2C现金红包PHP源码DEMO/兼容苹果/安卓浏览器和扫码形式
数据湖(二十):Flink兼容Iceberg目前不足和Iceberg与Hudi对比
多线程间的通信方式你知道几种?
【原创】启动Win10自带的XPS/OXPS阅读器