当前位置:网站首页>Selective Search学习笔记
Selective Search学习笔记
2022-08-03 16:12:00 【吃吃今天努力学习了吗】
Selective Search 方法主要有三个优势:
- 捕捉不同尺度 capture all scales
- 多样化 diversification
- 快速计算 fast to compute
总结为:选择性搜索是用于目标检测的区域提议算法,它计算速度快,具有很高的召回率,基于颜色,纹理,大小和形状兼容计算相似区域的分层分组。
selective search 算法主要包含两个内容:hierarchical grouping algorithm 和 diversification strategies
- hierarchical grouping algorithm:
图像中区域特征比像素更具代表性,作者先产生图像初始区域,使用贪心算法对区域进行迭代分组:
- 计算所有邻近区域之间的相似性
- 两个最相似的区域被组合在一起
- 计算合并区域和相邻区域的相似度
- 重复2/3过程,直到整个图像变成一个地区
在每次迭代中,形成更大的区域并将其添加到区域提议列表中。以自下而上的方式创建从较小的细分 segments 到较大细分 segments 的区域提案。
- diversification strategies
这部分是多样化的一些策略,使得抽样多样化,主要有下面三个不同方面:
- 利用各种不同不变性的色彩空间
- 采用不同的相似性度量
- 通过改变起始区域
colour spaces:
考虑到场景、光照条件的不同,作者提出使用八种不变性属性的各种颜色空间应用在 hierarchical grouping algorithm。
similarity measures:
- 颜色相似度衡量
- 纹理相似度衡量(论文采用SIFT-Like特征)
- 尺度相似度衡量(为了保证区域合并操作的尺度较为均匀,目的是尽量让小的区域先合并)
- 形状重合度衡量(为了衡量两个区域是否更加重合,合并后区域的bounding box越小,其重合度越高。
最终的相似度衡量由这四项组合而成。
Reference:
https://zhuanlan.zhihu.com/p/39927488
A u t h o r : C h i e r Author: Chier Author:Chier
边栏推荐
- C专家编程 第2章 这不是Bug,而是语言特性 2.4 少做之过
- mysql delete execution error: You can't specify target table 'doctor_info' for update in FROM clause
- C专家编程 第3章 分析C语言的声明 3.9 轻松一下---驱动物理实体的软件
- "Avnet Embedded Weekly" Issue 276: 2022.07.25--2022.07.31
- 新版本 MaxCompute 的SQL 中支持的 EXTRACT 函数有什么作用?
- Cookie和Session的关系
- 带你了解什么是 Web3.0
- smp,numa和mpp体系结构总结
- 13、OOM模拟
- 83. Remove Duplicates from Sorted List
猜你喜欢

《安富莱嵌入式周报》第276期:2022.07.25--2022.07.31

"Avnet Embedded Weekly" Issue 276: 2022.07.25--2022.07.31

机器人开发--Universal Scene Description(USD)

I am doing open source in Didi

How to get the 2 d space prior to ViT?UMA & Hong Kong institute of technology & ali SP - ViT, study for visual Transformer 2 d space prior knowledge!.

Yuan xiaolin: Volvo focus on travel security, and put it perfectly

建造者模式/生成器模式

视频人脸识别和图片人脸识别的关系
![[Unity Getting Started Plan] Basic Concepts (8) - Tile Map TileMap 01](/img/8e/fcf79d150af4384c14a118fb209725.png)
[Unity Getting Started Plan] Basic Concepts (8) - Tile Map TileMap 01

Web3 安全风险令人生畏?应该如何应对?
随机推荐
Analysis of ffplay video playback principle
C专家编程 第2章 这不是Bug,而是语言特性 2.4 少做之过
C专家编程 第2章 这不是Bug,而是语言特性 2.3 误做之过
纯纯粹粹纯纯粹粹
元宇宙系列--Value creation in the metaverse
smp,numa和mpp体系结构总结
滑环安装注意事项
spark入门学习-1
使用uniapp 封装一个request 请求
一文看懂推荐系统:召回01:基于物品的协同过滤(ItemCF),item-based Collaboration Filter的核心思想与推荐过程
【QT】Qt 给已经开发好的程序快速封装成动态库
【深度学习】今日bug(8月2)
Leetcode76. Minimal Covering Substring
【Unity入门计划】基本概念(6)-精灵渲染器 Sprite Renderer
C专家编程 第3章 分析C语言的声明 3.6 typedef int x[10]和#define x int[10]的区别
我在滴滴做开源
C专家编程 第2章 这不是Bug,而是语言特性 2.2 多做之过
视频人脸识别和图片人脸识别的关系
WordPress建站技术笔记
QT QT 】 【 to have developed a good program for packaging into a dynamic library