当前位置:网站首页>NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
2022-07-04 21:33:00 【智源社区】
预训练语言模型通过微调的方式在文本生成任务中取得了显著的进展,但是在数据稀疏的场景下,通常无法直接进行微调。因此,本文提出基于prompt的迁移学习的设定。作者先为源领域上的不同任务分别学习一个prompt,从而构造prompt池,然后在目标任务进行迁移。为了同时考虑任务层面和实例层面的信息,作者设计了一个自适应的注意力机制,对于目标任务中的每个实例样本,模型都会为其选择与其最相关的源任务的prompt。作者在多种生成任务和数据集上进行了实验,结果表明作者提出的迁移方法可以很好地提高目标任务上的生成效果。
论文标题:
Learning to Transfer Prompts for Text Generation
论文链接:
https://arxiv.org/abs/2205.01543
边栏推荐
- What is business intelligence (BI), just look at this article is enough
- How to implement Devops with automatic tools
- How much is the minimum stock account opening commission? Is it safe to open an account online
- Minidom module writes and parses XML
- QT—绘制其他问题
- Shutter textfield example
- new IntersectionObserver 使用笔记
- Kubeadm初始化报错:[ERROR CRI]: container runtime is not running
- WebGIS框架---kalrry
- gtest从一无所知到熟练使用(2)什么是测试夹具/装置(test fixture)
猜你喜欢
随机推荐
MP3是如何诞生的?
From repvgg to mobileone, including mobileone code
旋变串判断
[weekly translation go] how to code in go series articles are online!!
Super detailed tutorial, an introduction to istio Architecture Principle and practical application
【C语言】符号的深度理解
Methods of improving machine vision system
Kubedm initialization error: [error cri]: container runtime is not running
MongoDB聚合操作总结
gtest从一无所知到熟练使用(4)如何用gtest写单元测试
ArcGIS 10.2.2 | solution to the failure of ArcGIS license server to start
TCP shakes hands three times and waves four times. Do you really understand?
挖财学院股票开户安全吗?开户只能在挖财开户嘛?
【活动早知道】LiveVideoStack近期活动一览
股票开户流程是什么?使用同花顺手机炒股软件安全吗?
HDU - 2859 Phalanx(DP)
Jerry added the process of turning off the touch module before turning it off [chapter]
关系型数据库
Acwing 2022 daily question
机器学习笔记 - 互信息Mutual Information