当前位置:网站首页>NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
2022-07-04 21:33:00 【智源社区】
预训练语言模型通过微调的方式在文本生成任务中取得了显著的进展,但是在数据稀疏的场景下,通常无法直接进行微调。因此,本文提出基于prompt的迁移学习的设定。作者先为源领域上的不同任务分别学习一个prompt,从而构造prompt池,然后在目标任务进行迁移。为了同时考虑任务层面和实例层面的信息,作者设计了一个自适应的注意力机制,对于目标任务中的每个实例样本,模型都会为其选择与其最相关的源任务的prompt。作者在多种生成任务和数据集上进行了实验,结果表明作者提出的迁移方法可以很好地提高目标任务上的生成效果。
论文标题:
Learning to Transfer Prompts for Text Generation
论文链接:
https://arxiv.org/abs/2205.01543
边栏推荐
猜你喜欢
How was MP3 born?
El tree combined with El table, tree adding and modifying operations
QT - double buffer plot
TCP三次握手,四次挥手,你真的了解吗?
Daily question -leetcode1200- minimum absolute difference - array - sort
Compréhension approfondie du symbole [langue C]
机器学习笔记 - 互信息Mutual Information
QT - plot other problems
How to remove the black dot in front of the title in word document
Exclusive interview of open source summer | new committer Xie Qijun of Apache iotdb community
随机推荐
Cadeus has never stopped innovating. Decentralized edge rendering technology makes the metauniverse no longer far away
Bizchart+slider to realize grouping histogram
开源之夏专访|Apache IoTDB社区 新晋Committer谢其骏
WebGIS framework -- kalrry
ArcGIS 10.2.2 | solution to the failure of ArcGIS license server to start
Interviewer: what is XSS attack?
Maidong Internet won the bid of Beijing life insurance
Exclusive interview of open source summer | new committer Xie Qijun of Apache iotdb community
解读创客教育中的各类智能化组织发展
flink1.13 sql基础语法(一)DDL、DML
Jerry added the process of turning off the touch module before turning it off [chapter]
GTEST from ignorance to proficient use (2) what is test fixture
并列图的画法,多排多列
电话加密,中间4为****代替
旋变串判断
Kubedm initialization error: [error cri]: container runtime is not running
Cloudcompare & open3d DBSCAN clustering (non plug-in)
redis03——Redis的网络配置与心跳机制
MP3是如何诞生的?
机器学习笔记 - 互信息Mutual Information