当前位置:网站首页>NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
2022-07-04 21:33:00 【智源社区】
预训练语言模型通过微调的方式在文本生成任务中取得了显著的进展,但是在数据稀疏的场景下,通常无法直接进行微调。因此,本文提出基于prompt的迁移学习的设定。作者先为源领域上的不同任务分别学习一个prompt,从而构造prompt池,然后在目标任务进行迁移。为了同时考虑任务层面和实例层面的信息,作者设计了一个自适应的注意力机制,对于目标任务中的每个实例样本,模型都会为其选择与其最相关的源任务的prompt。作者在多种生成任务和数据集上进行了实验,结果表明作者提出的迁移方法可以很好地提高目标任务上的生成效果。

论文标题:
Learning to Transfer Prompts for Text Generation
论文链接:
https://arxiv.org/abs/2205.01543
边栏推荐
- GTEST from ignorance to proficient use (2) what is test fixture
- 解读创客教育中的各类智能化组织发展
- Delphi SOAP WebService 服务器端多个 SoapDataModule 实现相同的接口方法,接口继承
- [ 每周译Go ] 《How to Code in Go》系列文章上线了!!
- QT - plot other problems
- Daily question-leetcode556-next larger element iii-string-double pointer-next_ permutation
- MP3是如何诞生的?
- GTEST from ignorance to proficiency (4) how to write unit tests with GTEST
- 开户哪家券商比较好?网上开户安全吗
- How is the entered query SQL statement executed?
猜你喜欢

redis03——Redis的网络配置与心跳机制

解析互联网时代的创客教育技术

Exclusive interview of open source summer | new committer Xie Qijun of Apache iotdb community
![[public class preview]: basis and practice of video quality evaluation](/img/fd/42b98a08b5a0fd89c119f1d1a8fe1b.png)
[public class preview]: basis and practice of video quality evaluation
![[leetcode] 17. Letter combination of telephone number](/img/be/7f456c092f7cda5ebabc2f1cce292e.png)
[leetcode] 17. Letter combination of telephone number

【公开课预告】:视频质量评价基础与实践

创客思维在高等教育中的启迪作用

【LeetCode】17、电话号码的字母组合

Sorting and sharing of selected papers, systems and applications related to the most comprehensive mixed expert (MOE) model in history

历史最全混合专家(MOE)模型相关精选论文、系统、应用整理分享
随机推荐
Arcgis 10.2.2 | arcgis license server无法启动的解决办法
gtest从一无所知到熟练使用(4)如何用gtest写单元测试
Daily question-leetcode556-next larger element iii-string-double pointer-next_ permutation
面试题 01.08. 零矩阵
How to remove the black dot in front of the title in word document
开源之夏专访|Apache IoTDB社区 新晋Committer谢其骏
Is it safe to open an account in the stock of Caicai college? Can you only open an account by digging money?
Golang面试整理 三 简历如何书写
[wechat applet] collaborative work and release
Jerry's ad series MIDI function description [chapter]
Interviewer: what is XSS attack?
一文掌握数仓中auto analyze的使用
输入的查询SQL语句,是如何执行的?
GTEST from ignorance to skillful use (1) GTEST installation
类方法和类变量的使用
OMS系统实战的三两事
Analysis of maker education technology in the Internet Era
Minidom module writes and parses XML
Rotary transformer string judgment
SolidWorks工程图添加材料明细表的操作