当前位置:网站首页>Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
2022-07-01 01:30:00 【人工智能曾小健】
模型框架
从 ERNIE 1.0 起,百度研究者们就在预训练中引入知识增强学习,通过
掩码连续的词、
phrase、
named entity 等语义知识单元,
实现更好的预训练学习。本次开源的通用语义理解模型 ERNIE-Gram 更进一步,提出的显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
ERNIE 多粒度预训练语义理解技术
作为自然语言处理的基本语义单元,更充分的语言粒度学习能帮助模型实现更强的语义理解能力:
- ERNIE-Gram 提出显式完备的 n-gram 多粒度掩码语言模型,同步建模 n-gram 内部和 n-gram 之间的语义关系,实现同时学习**细粒度(fine-grained)和粗粒度(coarse-grained)**语义信息
- ERNIE-Gram 采用双流结构,在预训练过程中实现了单一位置多语义粒度层次预测,进一步增强了语义知识学习
ERNIE-Gram 多粒度预训练语义理解技术,在预训练 (pre-training) 阶段实现了显式的多粒度语义信号学习,在微调 (fine-tuning) 阶段采用 bert-style 微调方式,在不增加参数和计算复杂度的前提下,取得 10 项英文权威任务的 SOTA。在中文任务上,ERNIE-Gram 在包括 NLI、阅读理解等需要丰富、多层次的语义理解任务上取得公开 SOTA。
ERNIE-Gram 工作已被 NAACL-HLT 2021 作为长文收录,更多细节见 link。

ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding
边栏推荐
- php将二维数组元素转为键值对
- C # customize and dynamically switch cursor
- 数学知识:满足条件的01序列—求组合数
- 静态域与静态方法
- opencv -- 笔记
- LabVIEW计算相机图像传感器分辨率以及镜头焦距
- [content of content type request header]
- VirtualBox 安装增强功能
- 工作八年的程序员,却拿着毕业三年的工资,再不开窍就真晚了...
- org. redisson. client. Redisresponsetimeoutexception: redis server response timeout (3000 ms) error resolution
猜你喜欢

Neo4j installation, operation, project construction and function realization

Machine learning 10 belief Bayesian classifier

求两个线段公共部分的长度

The personal test is effective, and the JMeter desktop shortcut is quickly created

小程序中实现excel数据的批量导入

In the fourth week of June, the list - flying melon data up main growth ranking list (BiliBili platform) was released!

小程序云开发之--微信公众号文章采集篇

视频教程 | 长安链推出系列视频教程合集(入门)

1500w播放下还藏着什么热点?B站2个未来趋势你不得错过

Sitge joined the opengauss open source community to jointly promote the ecological development of the database industry
随机推荐
Short video platform development, relying on drawerlayout to achieve side sliding menu effect
AS400 API 从零到一的整个历程
[无线通信基础-14]:图解移动通信技术与应用发展-2-第一代移动模拟通信大哥大
Connectivity basis of Graphs
机器学习10-信念贝叶斯分类器
Upstream and downstream in software development
【2022年】江西省研究生数学建模方案、代码
P6773 [noi2020] destiny (DP, segment tree merging)
[stack] 921 Minimum Add to Make Parentheses Valid
Machine learning 10 belief Bayesian classifier
[JS adds attributes to elements: setAttribute; classlist.remove; classlist.add;]
System. Csrebot for commandline
With regard to the white box test, you have to master these skills~
工作6年,来盘点一下职场人混迹职场的黄金法则
In the fourth week of June, the list - flying melon data up main growth ranking list (BiliBili platform) was released!
Some essential differences
Laravel event & subscription
Gin configuration file
electron之坑addon
Mathematical knowledge: 01 sequence satisfying conditions - find combinatorial number