当前位置:网站首页>DETR介绍
DETR介绍
2022-07-07 11:07:00 【算法之名】
DETR是facebook发表于ECCV2020的使用Transformers进行端到端的目标检测的框架。
DETR只需要使用CNN提取图像特征,再单独使用Transformer就可以预测出目标边界框和分类。它不需要非极大值抑制,也不需要Anchor机制。
上图是DETR的网络架构图,DETR使用CNN提取图像特征,再单独使用Transformer得到预测出目标边界框,边界框和ground truth看作是一个几何预测问题。就是一个二分的匹配(bipartite matching),没有匹配上的物体归位no object这一类。
上图是更详细的描述DETR的网络结构,图像经过CNN获取到特征,再加上位置编码(poositioonal encoding),然后再展平送入到transformer encoder,encoder的输出再送入到transformer decoder,在decoder中还有object queries的输入,decoder的输出送入预测头(prediction heads),预测头中有前馈神经网络FFN进行物体类别和边界框的预测。
上图是DETR中Transformer具体的架构,它有Encoder和Decoder两部分,Encoder的输入就是CNN提取的图像特征加上位置编码,送入多头自注意力模块,再送入前馈神经网络模块。这样的Encoder层可以有多个,然后再送入Decoder,Decoder有Object queries,是可学习的位置嵌入作为输入,经过多头自注意力模块,再经过Encoder和Decoder之间的多头互注意力模块,再送入前馈神经网络处理。Decoder层也可以堆叠多个,最后送入前馈神经网络FFN进行物体类别预测和边界框的预测。
边栏推荐
- 关于 appium 如何关闭 app (已解决)
- Sample chapter of "uncover the secrets of asp.net core 6 framework" [200 pages /5 chapters]
- File operation command
- 国泰君安证券开户怎么开的?开户安全吗?
- [binary tree] delete points to form a forest
- Guangzhou held work safety conference
- Steps of building SSM framework
- 2022-07-07 Daily: Ian Goodfellow, the inventor of Gan, officially joined deepmind
- Cookie and session comparison
- 飞桨EasyDL实操范例:工业零件划痕自动识别
猜你喜欢
[untitled]
[untitled]
TPG x AIDU|AI领军人才招募计划进行中!
Per capita Swiss number series, Swiss number 4 generation JS reverse analysis
Leetcode skimming: binary tree 20 (search in binary search tree)
人均瑞数系列,瑞数 4 代 JS 逆向分析
【学习笔记】zkw 线段树
Adopt a cow to sprint A shares: it plans to raise 1.85 billion yuan, and Xu Xiaobo holds nearly 40%
Four functions of opencv
Analysis of DHCP dynamic host setting protocol
随机推荐
Awk of three swordsmen in text processing
非分区表转换成分区表以及注意事项
JS判断一个对象是否为空
[difficult and miscellaneous]pip running suddenly appears modulenotfounderror: no module named 'pip‘
2022 practice questions and mock examination of the third batch of Guangdong Provincial Safety Officer a certificate (main person in charge)
解决缓存击穿问题
基于鲲鹏原生安全,打造安全可信的计算平台
DrawerLayout禁止侧滑显示
DHCP 动态主机设置协议 分析
Leetcode brush question: binary tree 24 (the nearest common ancestor of binary tree)
Design and implementation of communication protocol
Sequoia China completed the new phase of $9billion fund raising
[untitled]
飞桨EasyDL实操范例:工业零件划痕自动识别
COSCon'22 社区召集令来啦!Open the World,邀请所有社区一起拥抱开源,打开新世界~
Four functions of opencv
【学习笔记】线段树选做
事务的七种传播行为
The URL modes supported by ThinkPHP include four common modes, pathinfo, rewrite and compatibility modes
ClickHouse(03)ClickHouse怎么安装和部署