当前位置:网站首页>DETR介绍
DETR介绍
2022-07-07 11:07:00 【算法之名】
DETR是facebook发表于ECCV2020的使用Transformers进行端到端的目标检测的框架。
DETR只需要使用CNN提取图像特征,再单独使用Transformer就可以预测出目标边界框和分类。它不需要非极大值抑制,也不需要Anchor机制。
上图是DETR的网络架构图,DETR使用CNN提取图像特征,再单独使用Transformer得到预测出目标边界框,边界框和ground truth看作是一个几何预测问题。就是一个二分的匹配(bipartite matching),没有匹配上的物体归位no object这一类。
上图是更详细的描述DETR的网络结构,图像经过CNN获取到特征,再加上位置编码(poositioonal encoding),然后再展平送入到transformer encoder,encoder的输出再送入到transformer decoder,在decoder中还有object queries的输入,decoder的输出送入预测头(prediction heads),预测头中有前馈神经网络FFN进行物体类别和边界框的预测。
上图是DETR中Transformer具体的架构,它有Encoder和Decoder两部分,Encoder的输入就是CNN提取的图像特征加上位置编码,送入多头自注意力模块,再送入前馈神经网络模块。这样的Encoder层可以有多个,然后再送入Decoder,Decoder有Object queries,是可学习的位置嵌入作为输入,经过多头自注意力模块,再经过Encoder和Decoder之间的多头互注意力模块,再送入前馈神经网络处理。Decoder层也可以堆叠多个,最后送入前馈神经网络FFN进行物体类别预测和边界框的预测。
边栏推荐
- mysql怎么创建,删除,查看索引?
- API query interface for free mobile phone number ownership
- .Net下极限生产力之efcore分表分库全自动化迁移CodeFirst
- [crawler] avoid script detection when using selenium
- Differences between MySQL storage engine MyISAM and InnoDB
- PACP学习笔记一:使用 PCAP 编程
- Shortcut key of Bash
- [difficult and miscellaneous]pip running suddenly appears modulenotfounderror: no module named 'pip‘
- TPG x AIDU|AI领军人才招募计划进行中!
- 《ASP.NET Core 6框架揭秘》样章[200页/5章]
猜你喜欢
随机推荐
Visual stdio 2017 about the environment configuration of opencv4.1
@What is the difference between resource and @autowired?
ClickHouse(03)ClickHouse怎么安装和部署
PACP学习笔记三:PCAP方法说明
Practical example of propeller easydl: automatic scratch recognition of industrial parts
【无标题】
日本政企员工喝醉丢失46万信息U盘,公开道歉又透露密码规则
【无标题】
SSM框架搭建的步骤
通过Keil如何查看MCU的RAM与ROM使用情况
leecode3. 无重复字符的最长子串
ICLR 2022 | pre training language model based on anti self attention mechanism
How to apply @transactional transaction annotation to perfection?
达晨与小米投的凌云光上市:市值153亿 为机器植入眼睛和大脑
Test next summary
PCAP学习笔记二:pcap4j源码笔记
Query whether a field has an index with MySQL
MySQL master-slave replication
. Net ultimate productivity of efcore sub table sub database fully automated migration codefirst
【无标题】