当前位置:网站首页>Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
2022-07-01 01:30:00 【人工智能曾小健】
模型框架
从 ERNIE 1.0 起,百度研究者们就在预训练中引入知识增强学习,通过
掩码连续的词、
phrase、
named entity 等语义知识单元,
实现更好的预训练学习。本次开源的通用语义理解模型 ERNIE-Gram 更进一步,提出的显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
ERNIE 多粒度预训练语义理解技术
作为自然语言处理的基本语义单元,更充分的语言粒度学习能帮助模型实现更强的语义理解能力:
- ERNIE-Gram 提出显式完备的 n-gram 多粒度掩码语言模型,同步建模 n-gram 内部和 n-gram 之间的语义关系,实现同时学习**细粒度(fine-grained)和粗粒度(coarse-grained)**语义信息
- ERNIE-Gram 采用双流结构,在预训练过程中实现了单一位置多语义粒度层次预测,进一步增强了语义知识学习
ERNIE-Gram 多粒度预训练语义理解技术,在预训练 (pre-training) 阶段实现了显式的多粒度语义信号学习,在微调 (fine-tuning) 阶段采用 bert-style 微调方式,在不增加参数和计算复杂度的前提下,取得 10 项英文权威任务的 SOTA。在中文任务上,ERNIE-Gram 在包括 NLI、阅读理解等需要丰富、多层次的语义理解任务上取得公开 SOTA。
ERNIE-Gram 工作已被 NAACL-HLT 2021 作为长文收录,更多细节见 link。

ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding
边栏推荐
- PHP数组拼接MySQL的in语句
- How does ZABBIX configure alarm SMS? (alert SMS notification setting process)
- [Qt5 basics] random number display
- AS400 大厂面试
- 3dsmax plug-in development traversal node object and object acquisition and inode transformation matrix description
- org. redisson. client. Redisresponsetimeoutexception: redis server response timeout (3000 ms) error resolution
- 模板:全局平衡二叉树
- Fast understanding of forward proxy and reverse proxy
- int和位数组互转
- P6773 [NOI2020] 命运(dp、线段树合并)
猜你喜欢

The whole process of AS400 API from zero to one

Lecun, a Turing Award winner, pointed out that the future of AI lies in self-learning, and the company has embarked on the journey

思特奇加入openGauss开源社区,共同推动数据库产业生态发展
![[无线通信基础-15]:图解移动通信技术与应用发展-3- 数字通信2G GSM、CDMA、3G WDCMA/CDMA200/TD-SCDMA、4G LTE、5G NR概述](/img/22/1efa444220131359b06005f597c9db.png)
[无线通信基础-15]:图解移动通信技术与应用发展-3- 数字通信2G GSM、CDMA、3G WDCMA/CDMA200/TD-SCDMA、4G LTE、5G NR概述

With one-stop insight into industry hot spots, the new function "traffic market" of feigua data station B is launched!

(翻译)使用眉状文本提高标题点击率

Batch import of Excel data in applet

机器学习9-通用逼近器径向基函数神经网络,在新观点下审视PDA和SVM

视频教程 | 长安链推出系列视频教程合集(入门)

45 year old programmer tells you: why do programmers want to change jobs? It's too true
随机推荐
机器学习10-信念贝叶斯分类器
[Office PDF] PDF merging and splitting will free us from the functional limitations of paid software, OK
数据探索电商平台用户行为流失分析
【毕业季·进击的技术er】--毕业到工作小结
[simulation] 922 Sort Array By Parity II
7-2 拼题A打卡奖励 dp
機器學習10-信念貝葉斯分類器
Ks009 implementation of pet management system based on SSH
【Content-Type请求头的内容】
[Qt5 tab] tab label and content hierarchical analysis
C#生成putty格式的ppk文件(支持passphrase)
[fundamentals of wireless communication-14]: illustrated mobile communication technology and application development-2-the first generation mobile analog communication big brother
3dsmax plug-in development traversal node object and object acquisition and inode transformation matrix description
PHP通过第三方插件爬取数据
Some items of OCR
3500 word summary: a complete set of skills that a qualified software testing engineer needs to master
Composants de la grille de données portatifs
Understanding and application of Qt5 layout in creation
What are the applications of SMS in enterprises?
AS400 大廠面試