当前位置:网站首页>ICML 2022 | Flowformer: 任务通用的线性复杂度Transformer
ICML 2022 | Flowformer: 任务通用的线性复杂度Transformer
2022-07-06 12:49:00 【智源社区】
论文标题:Flowformer: Linearizing Transformers with Conservation Flows
论文链接:https://arxiv.org/pdf/2202.06258.pdf
代码链接:https://github.com/thuml/Flowformer
本文深入研究了注意力机制存在的二次复杂度问题,通过将网络流中的守恒原理引入设计,自然地将竞争机制引入到注意力计算中,有效避免了平凡注意力问题。
我们提出的任务通用的骨干网络Flowformer,实现了线性复杂度,同时在长序列、视觉、自然语言、时间序列、强化学习五大任务上取得优秀效果。
在长序列建模应用上,如蛋白质结构预测、长文本理解等,Flowformer具有良好的应用潜力。此外,Flowformer中“无特殊归纳偏好”的设计理念也对通用基础架构的研究具有良好的启发意义。
Flow-Attention的伪代码如下:

主要实验结果:

边栏推荐
- 正则表达式收集
- Comment faire une radio personnalisée
- 审稿人dis整个研究方向已经不仅仅是在审我的稿子了怎么办?
- Swagger UI tutorial API document artifact
- What is the problem with the SQL group by statement
- 防火墙基础之外网服务器区部署和双机热备
- Intel 48 core new Xeon run point exposure: unexpected results against AMD zen3 in 3D cache
- Database - how to get familiar with hundreds of tables of the project -navicat these unique skills, have you got it? (exclusive experience)
- [DIY]如何制作一款个性的收音机
- 全网最全的知识库管理工具综合评测和推荐:FlowUs、Baklib、简道云、ONES Wiki 、PingCode、Seed、MeBox、亿方云、智米云、搜阅云、天翎
猜你喜欢

Detailed explanation of knowledge map construction process steps

OLED屏幕的使用

【OpenCV 例程200篇】220.对图像进行马赛克处理

请问sql group by 语句问题

Laravel笔记-自定义登录中新增登录5次失败锁账户功能(提高系统安全性)

全网最全的知识库管理工具综合评测和推荐:FlowUs、Baklib、简道云、ONES Wiki 、PingCode、Seed、MeBox、亿方云、智米云、搜阅云、天翎

Comment faire une radio personnalisée

Value of APS application in food industry

2022 portal crane driver registration examination and portal crane driver examination materials

1_ Introduction to go language
随机推荐
LLVM之父Chris Lattner:为什么我们要重建AI基础设施软件
OLED屏幕的使用
【微信小程序】运行机制和更新机制
SSO single sign on
硬件开发笔记(十): 硬件开发基本流程,制作一个USB转RS232的模块(九):创建CH340G/MAX232封装库sop-16并关联原理图元器件
Statistical inference: maximum likelihood estimation, Bayesian estimation and variance deviation decomposition
请问sql group by 语句问题
Leetcode hot topic Hot 100 day 32: "minimum coverage substring"
【每周一坑】计算100以内质数之和 +【解答】输出三角形
Minimum cut edge set of undirected graph
PG basics -- Logical Structure Management (transaction)
Hardware development notes (10): basic process of hardware development, making a USB to RS232 module (9): create ch340g/max232 package library sop-16 and associate principle primitive devices
快过年了,心也懒了
Deployment of external server area and dual machine hot standby of firewall Foundation
2022 portal crane driver registration examination and portal crane driver examination materials
[DSP] [Part 1] start DSP learning
No Yum source to install SPuG monitoring
Huawei device command
I've seen many tutorials, but I still can't write a program well. How can I break it?
OSPF multi zone configuration