当前位置:网站首页>深度学习:目标检测入门知识
深度学习:目标检测入门知识
2022-08-02 02:58:00 【青春可短暂了!】
目录
2. 重叠度 Intersection over Union(IoU)
一. 基本流程
RCNN算法分为4个步骤:
1.候选区域生成: 一张图像生成1K~2K个候选区域 (采用Selective Search 方法)
2.特征提取: 对每个候选区域,使用深度卷积网络提取特征 (CNN)
3.类别判断: 特征送入每一类的SVM 分类器,判别是否属于该类
4.位置精修: 使用回归器精细修正候选框位置
二. 基础知识
1. 有监督预训练与无监督预训练
(1)无监督预训练(Unsupervised pre-training)
预训练阶段的样本不需要人工标注数据,所以就叫做无监督预训练。
(2)有监督预训练(Supervised pre-training)
所谓的有监督预训练也可以把它称之为迁移学习。比如你已经有一大堆标注好的人脸年龄分类的图片数据,训练了一个CNN,用于人脸的年龄识别。然后当你遇到新的项目任务时:人脸性别识别,那么这个时候你可以利用已经训练好的年龄识别CNN模型,去掉最后一层,然后其它的网络层参数就直接复制过来,继续进行训练,让它输出性别。这就是所谓的迁移学习,说的简单一点就是把一个任务训练好的参数,拿到另外一个任务,作为神经网络的初始参数值,这样相比于你直接采用随机初始化的方法,精度可以有很大的提高。
对于目标检测问题: 图片分类标注好的训练数据非常多,但是物体检测的标注数据却很少,如何用少量的标注数据,训练高质量的模型
2. 重叠度 Intersection over Union(IoU)
物体检测需要定位出物体的bounding box,就像下面的图片一样,我们不仅要定位出塑料瓶的bounding box 我们还要识别出bounding box 里面的物体是塑料。

对于bounding box的定位精度,有一个很重要的概念: 因为我们算法不可能百分百跟人工标注的数据完全匹配,因此就存在一个定位精度评价公式:IOU。 它定义了两个bounding box的重叠度,如下图所示

3. 非极大值抑制(NMS)
RCNN会从一张图片中找出n个可能是物体的矩形框,然后为每个矩形框为做类别分类概率:

就像上面的图片一样:
1.定位一个车
2.算法就找出一堆的方框
3.判别哪些矩形框是没用的
判定方法就是非极大值抑制:
先假设有6个矩形框,根据分类器的类别分类概率做排序,假设从小到大属于车辆的概率 分别为A、B、C、D、E、F。
具体操作如下
(1)从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;
(2)假设B、D与F的重叠度超过阈值,那么就扔掉B、D,并标记第一个矩形框F,是我们保留下来的。
(3)从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。
就这样一直重复,找到所有被保留下来的矩形框。
总结:
非极大值抑制(NMS)顾名思义就是抑制不是极大值的元素,搜索局部的极大值。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。这里不讨论通用的NMS算法,而是用于在目标检测中用于提取分数最高的窗口的。例如在行人检测中,滑动窗口经提取特征,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高(是行人的概率最大),并且抑制那些分数低的窗口。
4. VOC物体检测任务
相当于一个竞赛,里面包含了20个物体类别:PASCAL VOC2011 Example Images 还有一个背景,总共就相当于21个类别,因此一会设计fine-tuning CNN的时候,我们softmax分类输出层为21个神经元。
边栏推荐
猜你喜欢

分布式事务解决方案模型

MySQL中根据日期进行范围查询

mysql8.0.28下载和安装详细教程,适配win11

数仓:为什么说 ETL 的未来不是 ELT,而是 EL (T)

"Paid paddling" stealthily brushes Brother Ali's face scriptures, challenges bytes three times, and finally achieves positive results

第11章_数据库的设计规范

- daily a LeetCode 】 【 9. Palindrome

PHP WebSehll backdoor script and detection tool

analog IC layout

MySQL8--Windows下使用msi(图形界面)安装的方法
随机推荐
Chapter 10_Index Optimization and Query Optimization
(1) Redis: Key-Value based storage system
node:internal/modules/cjs/loader:936 throw err; ^ Error: Cannot find module ‘./scope‘
给你一个大厂面试的机会,你能面试上吗?进来看看!
AcWing 1053. Repair DNA problem solution (state machine DP, AC automata)
aws s3 upload file
递归检查配置项是否更变并替换
WebShell连接工具(中国菜刀、WeBaCoo、Weevely)使用
7-41 PAT排名汇总 (25 分)多样排序
PHP WebSehll backdoor script and detection tool
面试必备!TCP协议经典十五连问!
Reasons and solutions for Invalid bound statement (not found)
CentOS7安装Oracle数据库的全流程
Nacos源码分析专题(二)-服务注册
【LeetCode】144. Preorder Traversal of Binary Tree
【LeetCode】104. Maximum depth of binary tree
VPS8701 电源管理(PMIC) VPS8701
MySQL索引优化实战
MySQL8.0.28安装教程
【LeetCode】206.反转链表