当前位置:网站首页>大道至简 | 设计 ViT 到底怎么配置Self-Attention才是最合理的?
大道至简 | 设计 ViT 到底怎么配置Self-Attention才是最合理的?
2022-06-09 12:55:00 【智源社区】

Transformer已成为深度学习中的主要架构之一,尤其是作为计算机视觉中卷积神经网络 (CNN) 的强大替代品。然而,由于Self-Attention在长序列表示上的二次复杂性,特别是对于高分辨率密集预测任务,先前工作中的Transformer训练和推理可能非常昂贵。为此,我们提出了一种新颖的少注意力视觉Transformer(LIT),基于Transformers中早期的Self-Attention仍然专注于局部模式,并在最近的分层视觉Transformers中带来较小的好处。
具体来说,提出了一个分层 Transformer,使用纯多层感知器(MLP)在早期阶段对丰富的局部模式进行编码,同时应用Self-Attention模块在更深层捕获更长的依赖关系。此外,进一步提出了一种 Learned Deformable Token Merging Module,以非均匀方式自适应地融合信息Patch。
所提出的 LIT 在图像识别任务(包括图像分类、对象检测和实例分割)上取得了可观的性能,可作为许多视觉任务的强大支柱。
论文地址:https://arxiv.org/abs/2105.14217
开源地址:https://github.com/zhuang-group/LIT
边栏推荐
- At the age of 26, he published 18 papers and just proved the prime number conjecture of the last century
- 超越ReLU却鲜为人知,3年后被挖掘:BERT、GPT-2等都在用的激活函数
- 在这些根技术里,读懂华为的“三观”
- 输入一行字符(最多80个),从第location个位置开始,截取number个字符并将其输出。
- QUIC必看
- ERC721非同质代币(NFT)介绍
- Uniswap合约学习-- Uniswap UNI Token
- #yyds干货盘点# 解决剑指offer:矩形覆盖
- C语言 结构体 | 链表
- 占位智能家居市场,施耐德电气仅靠一个Wiser系统?
猜你喜欢

Lossy transmission instance

Analysis on the resumption of the most serious downtime in the history of Facebook on October 4, 2021

Software test engineers teach you how to make test plans

Yunna RFID asset management, advantages of RFID asset management system

#yyds干货盘点# 解决剑指offer:矩形覆盖

打蛇打七寸

TCP(滑动窗口,流量控制)
![[leetcode weekly race record] record of the 79th biweekly race + the 295th weekly race](/img/ce/bf00add3a54f9efd0776dda522f31f.png)
[leetcode weekly race record] record of the 79th biweekly race + the 295th weekly race

Little known beyond relu, it was discovered three years later: the activation functions used by Bert, gpt-2, etc

NeRF神经辐射场ECCV2020
随机推荐
Install MySQL in MySQL installer mode
记忆化搜索+状态压缩leetcode.464
Digital transformation: how to gain organizational recognition?
Yunna RFID asset management, advantages of RFID asset management system
Analysis of network visualization analysis technology
Development and present situation of Network Space Surveying and mapping at home and abroad
Repo process
AI 考生挑战高考作文,平均 1 秒生成 1 篇,水平超 75% 考生
【clickhouse专栏】单机版的安装与验证
2022.5.24-----leetcode.965
ARIMA加法季节模型
3. download stock code and other basic information
驻美国大使馆提醒在美中国公民注意暑期出行安全
虚拟消费引领新时尚 互融云NFT系统平台定制开发 助力企业打开“Z”时代
面试题 05.08. 绘制直线
他26岁,发表论文18篇,刚把上世纪的素数猜想给证明了
C language structure | linked list
未磁科技完成超亿元A轮融资,核心团队毕业于北航
2022.5.27-----leetcode.面试17.11
Explain asynchronous tasks in detail: the task of function calculation triggers de duplication