当前位置：网站首页>ICLR 2022 | 基于对抗自注意力机制的预训练语言模型

ICLR 2022 | 基于对抗自注意力机制的预训练语言模型

2022-07-06 15:33:00 【智源社区】

论文名称：

Adversarial Self-Attention For Language Understanding

论文来源：

ICLR 2022

论文链接：

https://arxiv.org/pdf/2206.12608.pdf

本文提出了 Adversarial Self-Attention 机制（ASA），利用对抗训练重构 Transformer 的注意力，使模型在被污染的模型结构中得到训练。

尝试解决的问题：

大量的证据表明，自注意力可以从 allowing bias 中获益，allowing bias 可以将一定程度的先验（如 masking，分布的平滑）加入原始的注意力结构中。这些先验知识能够让模型从较小的语料中学习有用的知识。但是这些先验知识一般是任务特定的知识，使得模型很难扩展到丰富的任务上。
adversarial training 通过给输入内容添加扰动来提升模型的鲁棒性。作者发现仅仅给 input embedding 添加扰动很难 confuse 到 attention maps. 模型的注意在扰动前后没有发生变化。

为了解决上述问题，作者提出了 ASA， 具有以下的优势：

版权声明
本文为[智源社区]所创，转载请带上原文链接，感谢
https://hub.baai.ac.cn/views/18662