当前位置:网站首页>[阅读笔记] For:Object Detection with Deep Learning: The Definitive Guide
[阅读笔记] For:Object Detection with Deep Learning: The Definitive Guide
2022-07-28 16:33:00 【jsBeSelf】
文章指路:Object Detection with Deep Learning: The Definitive Guide
1 对比其他计算机视觉问题
1.1 图像分类
算是计算机视觉里比较著名的问题了,即一张图对应于多个类别概率,并取最高者为该图的标签。学术界内最为著名的一个数据集为 ImageNet 以及 它的竞赛 ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 。机遇与挑战并存。
1.2 目标定位
在解决生活中某些问题时比较实用,比如智能裁剪,裁剪出我们感兴趣的区域。
1.3 目标检测
将分类(对物体的分类)与定位结合起来,其实就是目标检测的任务。
1.4 实例分割
比目标检测更进一步,想要实现像素到像素的分类。
2 目标检测的一些应用场景
2.1 人脸检测
已经可以很方便地应用在摄像头上,检测人脸可以方便拍照时自动对焦,进一步可以实现人脸识别。
2.2 计数
比如人群计数,车流计数,农作物计数等等,可以将计算机视觉所见的原始数据转化为结构化数据。与无人机/卫星结合,可以看到更广更远,实现更丰富的计数应用。
2.3 搜索引擎
当你浏览某类商品时,它能自动化推荐出其他同类的商品,那么自然就是通过在各个地方检测出同类商品,并收集过来显示在页面上。
3 要实现目标检测所要面临的问题
1)多目标:不同于图像分类,目标检测面临的可能是大量的待检测的物体
2)多尺度:这些物体可能占据整张图片,也可能小到十几像素
3)多任务:一个模型要同时实现分类+定位的任务
4)数据集:数据集的好坏也决定了模型的好坏,但是构建数据集的成本较大
4 基于深度学习的目标检测
4.1 传统机器学习方法
1)定位:滑动窗口
2)提取特征:HOG,SIFT
3)分类:SVM
这里不进一步展开
4.2 深度学习模型
百家争鸣
1)OverFeat:提出了一种使用卷积神经网络 (CNN) 的多尺度滑动窗口算法。
2)R-CNN:将CNN应用到目标检测上的开山之作,主要方法为:
- 使用SS算法生成推荐区域
- 使用CNN提取特征
- 使用SVM作分类
问题:训练复杂;没有较好的分类方法;内部模型分离。
3)Fast R-CNN:R-CNN系列第二作,将分类与回归和特征提取网络耦合,接近于端到端(end-to-end)。
问题:区域框的生成算法是瓶颈。
4)Faster R-CNN:R-CNN系列第三作,其实就是RPN(Region Proposal Network)+Fast R-CNN。
5)YOLO系列:兼顾实时性和准确率的模型,是one-stage类型算法。
6)此外还有SSD,R-FCN等模型。
5 总结
总之,有问题存在,就意味着目标检测领域还有很大的上升空间,机遇与挑战并存,了解完前人的智慧后,站在巨人的肩膀上,将会有更多新方法诞生。
边栏推荐
- 软件测试培训两个月可以就业吗?
- Alibaba P8 architect talk: seven knowledge points (including interview questions) that must be learned well to become an architect
- Mqtt.fx connects to Alibaba cloud Internet of things platform
- @RequestMapping详解
- 想转行IT,非科班出身真的不要紧吗?
- Solve package is not available (for R ve [package 'xxx' is not available (for R version x.y.z) "warning?]
- Vscode plug-in automatically adds comments
- 软件测试需要学习多久?
- R中因子(factor)
- MySQL triggers
猜你喜欢
随机推荐
软件测试行业真的饱和了吗?
The difference between using switch in a loop and using break and continue after executing a condition
Adding new objects to the object array in JS results in the modification of existing objects in the array
软件测试培训两个月靠谱吗?
【C语言必看】哟写BUG呢,我敢保证你踩过坑
数据库优化——深入理解Mysql索引底层数据结构与算法
区分ES6的export与Nodejs的module.exports的区别
零基础学习软件测试有什么条件?
Convert the image file of input type='file'to Base64
ionic 中遇到的一些东西
Backup and restore of SNAT and DNAT firewall rules
转行学习软件测试有前途吗?
ionic中的$ionicPopup连续两个调用alert时需要注意的事项
AMQP protocol details
JS中为对象数组添加新对象结果导致数组中已存在的对象也修改了
【无标题】
The easy-to-use special app testing tool itest4.7.0 has been released
软件测试前景如何?该如何进行学习呢?
Insert text watermark in PDF
软件测试的培训机构靠谱吗









