当前位置:网站首页>14、Transformer--VIT TNT BETR
14、Transformer--VIT TNT BETR
2022-07-05 20:18:00 【C--G】
VIT–Vision Transformer


VIT架构图



VIT为图像分类任务,这里使用了transformer的编码器,将图片分为九块,加上位置编码后并转化为一维再放入编码器,编码器此时有9个输入token,其中0号token与其他9位token进行了交互计算,融合了其他9位token的特征信息,因此只需要0号token即可,后面就是MLP Head和分类即可
- CNN的问题

- transformer优势

- 公式

- VIT格局

- 位置编码

- 效果分析

- 代码链接
https://github.com/WZMIAOMIAO/deep-learning-for-image-processing/tree/master/pytorch_classification/vision_transformer
TNT-Transformer in Transformer

- 基本组成

- 序列构建

- 基本计算

- 位置编码

- PatchEmbedding可视化

BETR
目标检测

基本思想

并行预测100个坐标框,没有物体,那就是背景网络架构

cnn获取一维特征图,positional encoding获取位置编码,与VIT不同,BETR没有0号token,与传统Transformer Decoder不同,BETR是由object queries一次产生多少坐标框,每个框并行与encoder输出进行匹配,再通过prediction heads判断是否是目标框
Encoder的任务

encoder提供目标的注意力结果优于cnn的特征图结果,有利于解码器快速识别目标,如图所示,encoder在有遮挡情况下也能很好的识别物体网络架构

输出匹配

注意力的作用


数据资源–大佬的博客
https://blog.csdn.net/qq_37774399/article/details/121748163
边栏推荐
- Leetcode brush question: binary tree 14 (sum of left leaves)
- C langue OJ obtenir PE, ACM démarrer OJ
- sun. misc. Base64encoder error reporting solution [easy to understand]
- 怎么挑选好的外盘平台,安全正规的?
- js方法传Long类型id值时会出现精确损失
- 全国爱眼教育大会,2022第四届北京国际青少年眼健康产业展会
- 如何形成规范的接口文档
- How to retrieve the root password of MySQL if you forget it
- 秋招字节面试官问你还有什么问题?其实你已经踩雷了
- 基础篇——配置文件解析
猜你喜欢

Hong Kong stocks will welcome the "best ten yuan store". Can famous creative products break through through the IPO?

Parler de threadlocal insecurerandom

Zero cloud new UI design

JVMRandom不可设置种子|问题追溯|源码追溯

解决php无法将string转换为json的办法

Mysql频繁操作出现锁表问题

Station B up builds the world's first pure red stone neural network, pornographic detection based on deep learning action recognition, Chen Tianqi's course progress of machine science compilation MLC,

leetcode刷题:二叉树15(找树左下角的值)

How to select the Block Editor? Impression notes verse, notation, flowus

ROS2专题【01】:win10上安装ROS2
随机推荐
港股将迎“最牛十元店“,名创优品能借IPO突围?
字节跳动Dev Better技术沙龙成功举办,携手华泰分享Web研发效能提升经验
物联网智能家居基本方法实现之经典
无卷积骨干网络:金字塔Transformer,提升目标检测/分割等任务精度(附源代码)...
Scala基础【HelloWorld代码解析,变量和标识符】
CVPR 2022 | 常见3D损坏和数据增强
[quick start of Digital IC Verification] 1. Talk about Digital IC Verification, understand the contents of the column, and clarify the learning objectives
解决php无法将string转换为json的办法
走入并行的世界
Debezium series: modify the source code to support drop foreign key if exists FK
Notes on key vocabulary in the English original of the biography of jobs (12) [chapter ten & eleven]
js实现禁止网页缩放(Ctrl+鼠标、+、-缩放有效亲测)
mongodb基操的练习
【数字IC验证快速入门】7、验证岗位中必备的数字电路基础知识(含常见面试题)
js方法传Long类型id值时会出现精确损失
leetcode刷题:二叉树17(从中序与后序遍历序列构造二叉树)
[C language] three implementations of quick sorting and optimization details
USACO3.4 “破锣摇滚”乐队 Raucous Rockers - DP
Schema和Model
[quick start of Digital IC Verification] 3. Introduction to the whole process of Digital IC Design