当前位置:网站首页>目标检测学习笔记
目标检测学习笔记
2022-07-31 05:09:00 【Cheng-O】
研究背景
计算机三大热门方向:计算机视觉、自然语言处理(NLP)以及语音识别
计算机视觉研究方向:
物体识别和检测
找出图片中常见的物体,并将其类别和位置输出,比如:人脸检测,车辆检测
识别:分类出哪些样本是目标
检测:从随机有干扰的图片中检测出有信息的特征
词义分割
对图像中的每个像素点进行分类,相当于对图片中的目标进行分割
运动和跟踪
在视频开始时给出目标的位置以及尺寸,然后在视频后续中对其进行追踪
视觉问答
目的旨在根据输入图像,由用户进行提问,而算法自动根据提问内容进行回答


物体检测的意义
研究角度看,是计算机视觉的根本问题之一,是很多高层视觉任务的基础
高层视觉任务:人脸识别、行人再辨识、目标跟踪、图像分类
应用角度看,已经表示出广泛的应用需求
物体检测应用:人脸解锁、视频监控、出入口人数统计、辅助驾驶、自动驾驶
发展脉络


单阶段法只需要对锚框进行一次矫正就能得到最终结果,而多阶段法需要多次矫正。
传统方法
利用手工特征+分类器,以滑窗方式在图像金字塔上遍历所有位置和大小,进行物体检测
滑窗方式遍历所有的位置,图像金字塔遍历不同大小
常用数据集

通用物体检测数据集

人脸检测数据集

评价指标
检测精度
交除并重叠比(IoU)= 交集面积 / 并集面积
召回率 = 被召回的真实标注的数量(标注对的数量)/ 真实标注的数量(实际目标的数量)
精度 = 真正例的数量(标注对的数量) / 检测结果的数量(检测到的数量)
召回是看检测的是否全面,精度是看检测的是否准确
平均精度均值(mAP ) 所有种类平均精度(AP)的均值
平均精度 精度-召回率曲线下的面积
漏检率(Miss rate) = 漏检的数量 / 真实标注的数量
平均每张图的虚捡个数(FPPI)= 漏检个数 / 图片数
检测速度
前传耗时(ms) = 从输入一张图片到输出最终结果所消耗的时间
每秒帧数(FPS)= 每秒能处理的图像数量
作业

Overfeat:Integrated Recognition, Localization and Detection using Convolutional Networks
R-CNN:
R-CNN论文详解(论文翻译)_Cheese的博客-CSDN博客_r-cnn
fast RCNN:
Fast R-CNN论文详解_WoPawn的博客-CSDN博客_fasterrcnn论文
faster-RCNN
Faster R-CNN文章详细解读_Michael’s Blog-CSDN博客
FPN:feature pyramid networks for object detection
FPN(feature pyramid networks)算法讲解_AI之路-CSDN博客_feature pyramid
YOLO:
YOLO系列算法精讲:从yolov1至yolov4的进阶之路(2万字超全整理,建议收藏!)_不积跬步,无以至千里!-CSDN博客_yolo系列算法
SSD:
SSD原理解读-从入门到精通_QQ哥的专栏-CSDN博客_ssd原理
R-FCN:object detection via region-based fully convolutional networks
R-FCN算法及Caffe代码详解_AI之路-CSDN博客_fcn代码详解
DCN:Deep & Cross Network for Ad Click Predictions
推荐系统深度学习篇-DCN网络介绍(2)_来自Daisy和她的单程车票-CSDN博客_dcn网络
RetinaNet:Focal Loss for Dense Object Detection
RetinaNet论文理解_JustForYou的博客-CSDN博客_retinanet
Mask R-CNN:
【Mask RCNN】论文详解(真的很详细)_咖啡味儿的咖啡-CSDN博客_mask rcnn

召回率:4 / 5
精度:4 / 6
漏检率:1 / 6
边栏推荐
- ABC D - Distinct Trio(k元组的个数
- MYSQL下载及安装完整教程
- Minio上传文件ssl证书不受信任
- Lua,ILRuntime, HybridCLR(wolong)/huatuo hot update comparative analysis
- 城市内涝及桥洞隧道积水在线监测系统
- 1. Get data - requests.get()
- Minio upload file ssl certificate is not trusted
- Numpy中np.meshgrid的简单用法示例
- ABC D - Distinct Trio (Number of k-tuples
- 面试Redis 高可靠性|主从模式、哨兵模式、Cluster集群模式
猜你喜欢

Multiple table query of sql statement

DVWA靶场环境搭建

The Vue project connects to the MySQL database through node and implements addition, deletion, modification and query operations
![Unity Tutorial: URP Rendering Pipeline Practical Tutorial Series [1]](/img/7c/c9ab32bbf43b933e5f84f0d142f7bd.jpg)
Unity Tutorial: URP Rendering Pipeline Practical Tutorial Series [1]

mysql存储过程

MySQL常见面试题汇总(建议收藏!!!)

面试官,不要再问我三次握手和四次挥手

Minesweeper game (written in c language)

MySQL事务隔离级别详解

mysql使用on duplicate key update批量更新数据
随机推荐
ERROR 1819 (HY000) Your password does not satisfy the current policy requirements
MySQL window function
有了MVC,为什么还要DDD?
Goodbye to the cumbersome Excel, mastering data analysis and processing technology depends on it
ERROR 1064 (42000) You have an error in your SQL syntax; check the manual that corresponds to your
MySQL (updating)
MySQL forgot password
【JS面试题】面试官:“[1,2,3].map(parseInt)“ 输出结果是什么?答上来就算你通过面试
【一起学Rust】Rust的Hello Rust详细解析
可点击也可直接复制指定内容js
MySQL事务隔离级别详解
MYSQL一站式学习,看完即学完
Centos7 install mysql5.7 steps (graphical version)
110 MySQL interview questions and answers (continuously updated)
Go language study notes - dealing with timeout problems - Context usage | Go language from scratch
Minesweeper game (written in c language)
mysql uses on duplicate key update to update data in batches
MySQL忘记密码怎么办
MySQL常见面试题汇总(建议收藏!!!)
Tapdata 与 Apache Doris 完成兼容性互认证,共建新一代数据架构