当前位置:网站首页>14、Transformer--VIT TNT BETR
14、Transformer--VIT TNT BETR
2022-07-05 20:18:00 【C--G】
VIT–Vision Transformer
VIT架构图
VIT为图像分类任务,这里使用了transformer的编码器,将图片分为九块,加上位置编码后并转化为一维再放入编码器,编码器此时有9个输入token,其中0号token与其他9位token进行了交互计算,融合了其他9位token的特征信息,因此只需要0号token即可,后面就是MLP Head和分类即可
- CNN的问题
- transformer优势
- 公式
- VIT格局
- 位置编码
- 效果分析
- 代码链接
https://github.com/WZMIAOMIAO/deep-learning-for-image-processing/tree/master/pytorch_classification/vision_transformer
TNT-Transformer in Transformer
- 基本组成
- 序列构建
- 基本计算
- 位置编码
- PatchEmbedding可视化
BETR
目标检测
基本思想
并行预测100个坐标框,没有物体,那就是背景网络架构
cnn获取一维特征图,positional encoding获取位置编码,与VIT不同,BETR没有0号token,与传统Transformer Decoder不同,BETR是由object queries一次产生多少坐标框,每个框并行与encoder输出进行匹配,再通过prediction heads判断是否是目标框
Encoder的任务
encoder提供目标的注意力结果优于cnn的特征图结果,有利于解码器快速识别目标,如图所示,encoder在有遮挡情况下也能很好的识别物体网络架构
输出匹配
注意力的作用
数据资源–大佬的博客
https://blog.csdn.net/qq_37774399/article/details/121748163
边栏推荐
- 【c语言】快速排序的三种实现以及优化细节
- A solution to PHP's inability to convert strings into JSON
- Unity编辑器扩展 UI控件篇
- js方法传Long类型id值时会出现精确损失
- After 95, Alibaba P7 published the payroll: it's really fragrant to make up this
- Rainbond 5.7.1 支持对接多家公有云和集群异常报警
- DP: tree DP
- Leetcode brush question: binary tree 13 (the same tree)
- A way to calculate LNX
- 1: Citation;
猜你喜欢
CTF逆向基础
Leetcode skimming: binary tree 16 (path sum)
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
JS implementation prohibits web page zooming (ctrl+ mouse, +, - zooming effective pro test)
leetcode刷题:二叉树12(二叉树的所有路径)
【数字IC验证快速入门】6、Questasim 快速上手使用(以全加器设计与验证为例)
实操演示:产研团队如何高效构建需求工作流?
Parler de threadlocal insecurerandom
CVPR 2022 | 常见3D损坏和数据增强
【数字IC验证快速入门】9、Verilog RTL设计必会的有限状态机(FSM)
随机推荐
Codeforces Round #804 (Div. 2) - A, B, C
本季度干货导航 | 2022年Q2
JVMRandom不可设置种子|问题追溯|源码追溯
Leetcode brush questions: binary tree 18 (largest binary tree)
ffplay文档[通俗易懂]
关于BRAM IP复位的优先级
【c语言】归并排序
How to select the Block Editor? Impression notes verse, notation, flowus
什么是pyc文件
ICTCLAS word Lucene 4.9 binding
鸿蒙系统控制LED的实现方法之经典
selenium 元素信息
c语言oj得pe,ACM入门之OJ~
[quick start of Digital IC Verification] 6. Quick start of questasim (taking the design and verification of full adder as an example)
Go language learning tutorial (16)
解决Thinkphp框架应用目录下数据库配置信息修改后依然按默认方式连接
Based on vs2017 and cmake GUI configuration, zxing and opencv are used in win10 x64 environment, and simple detection of data matrix code is realized
Go language | 03 array, pointer, slice usage
[quick start of Digital IC Verification] 1. Talk about Digital IC Verification, understand the contents of the column, and clarify the learning objectives
ICTCLAS用的字Lucene4.9捆绑