当前位置:网站首页>NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
NAACL-22 | 在基于Prompt的文本生成任务上引入迁移学习的设置
2022-07-04 21:33:00 【智源社区】
预训练语言模型通过微调的方式在文本生成任务中取得了显著的进展,但是在数据稀疏的场景下,通常无法直接进行微调。因此,本文提出基于prompt的迁移学习的设定。作者先为源领域上的不同任务分别学习一个prompt,从而构造prompt池,然后在目标任务进行迁移。为了同时考虑任务层面和实例层面的信息,作者设计了一个自适应的注意力机制,对于目标任务中的每个实例样本,模型都会为其选择与其最相关的源任务的prompt。作者在多种生成任务和数据集上进行了实验,结果表明作者提出的迁移方法可以很好地提高目标任务上的生成效果。
论文标题:
Learning to Transfer Prompts for Text Generation
论文链接:
https://arxiv.org/abs/2205.01543
边栏推荐
- Which securities company is better to open an account? Is online account opening safe
- TCP protocol three times handshake process
- TCP三次握手,四次挥手,你真的了解吗?
- Solve the problem of data disorder caused by slow asynchronous interface
- 输入的查询SQL语句,是如何执行的?
- el-tree结合el-table,树形添加修改操作
- Bookmark
- 股票开户流程是什么?使用同花顺手机炒股软件安全吗?
- GTEST from ignorance to proficiency (4) how to write unit tests with GTEST
- 一文掌握数仓中auto analyze的使用
猜你喜欢
Cloudcompare & open3d DBSCAN clustering (non plug-in)
Redis 排查大 key 的3种方法,优化必备
QT—双缓冲绘图
超详细教程,一文入门Istio架构原理及实战应用
MP3是如何诞生的?
[leetcode] 17. Letter combination of telephone number
Enlightenment of maker thinking in Higher Education
How is the entered query SQL statement executed?
解读创客教育中的各类智能化组织发展
Methods of improving machine vision system
随机推荐
Solve the problem of data disorder caused by slow asynchronous interface
Jerry's ad series MIDI function description [chapter]
Jerry's ad series MIDI function description [chapter]
解析steam教育中蕴含的众创空间
1807. 替换字符串中的括号内容
什么是商业智能(BI),就看这篇文章足够了
HDU - 1078 fatmouse and cheese (memory search DP)
Use of class methods and class variables
开源之夏专访|Apache IoTDB社区 新晋Committer谢其骏
[ 每周译Go ] 《How to Code in Go》系列文章上线了!!
Redis 排查大 key 的3种方法,优化必备
【C语言】符号的深度理解
Rotary transformer string judgment
QT—绘制其他问题
保证接口数据安全的10种方案
关系型数据库
Flutter WebView示例
How to remove the black dot in front of the title in word document
Basic structure of PostgreSQL - table
GTEST from ignorance to proficiency (3) what are test suite and test case