当前位置:网站首页>Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
2022-07-01 01:30:00 【人工智能曾小健】
模型框架
从 ERNIE 1.0 起,百度研究者们就在预训练中引入知识增强学习,通过
掩码连续的词、
phrase、
named entity 等语义知识单元,
实现更好的预训练学习。本次开源的通用语义理解模型 ERNIE-Gram 更进一步,提出的显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
ERNIE 多粒度预训练语义理解技术
作为自然语言处理的基本语义单元,更充分的语言粒度学习能帮助模型实现更强的语义理解能力:
- ERNIE-Gram 提出显式完备的 n-gram 多粒度掩码语言模型,同步建模 n-gram 内部和 n-gram 之间的语义关系,实现同时学习**细粒度(fine-grained)和粗粒度(coarse-grained)**语义信息
- ERNIE-Gram 采用双流结构,在预训练过程中实现了单一位置多语义粒度层次预测,进一步增强了语义知识学习
ERNIE-Gram 多粒度预训练语义理解技术,在预训练 (pre-training) 阶段实现了显式的多粒度语义信号学习,在微调 (fine-tuning) 阶段采用 bert-style 微调方式,在不增加参数和计算复杂度的前提下,取得 10 项英文权威任务的 SOTA。在中文任务上,ERNIE-Gram 在包括 NLI、阅读理解等需要丰富、多层次的语义理解任务上取得公开 SOTA。
ERNIE-Gram 工作已被 NAACL-HLT 2021 作为长文收录,更多细节见 link。
ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding
边栏推荐
- What are the preferential activities for stock account opening? In addition, is it safe to open a mobile account?
- AS400 大廠面試
- Analysis on user behavior loss of data exploration e-commerce platform
- Check the disk usage of MySQL database
- AS400 API 从零到一的整个历程
- Log4j2 threadcontext log link tracking
- 数学知识:求组合数 IV—求组合数
- Laravel+redis generates an order number - automatically increase from 1 on the same day
- [Office PDF] PDF merging and splitting will free us from the functional limitations of paid software, OK
- AS400 large factory interview
猜你喜欢
那些一门心思研究自动化测试的人,后来怎样了?
Compile and install oh my Zsh
Int and bit group turn to each other
【JS】【掘金】获取关注了里不在关注者里的人
[Qt5 tab] tab label and content hierarchical analysis
Video tutorial | Chang'an chain launched a series of video tutorial collections (Introduction)
Neo4j installation, operation, project construction and function realization
FL studio20.9 fruit software advanced Chinese edition electronic music arrangement
FL Studio20.9水果软件高级中文版电音编曲
KS009基于SSH实现宠物管理系统
随机推荐
How does ZABBIX configure alarm SMS? (alert SMS notification setting process)
The personal test is effective, and the JMeter desktop shortcut is quickly created
[无线通信基础-15]:图解移动通信技术与应用发展-3- 数字通信2G GSM、CDMA、3G WDCMA/CDMA200/TD-SCDMA、4G LTE、5G NR概述
45 year old programmer tells you: why do programmers want to change jobs? It's too true
With one-stop insight into industry hot spots, the new function "traffic market" of feigua data station B is launched!
QT web development - VIDEO - Notes
远程办公如何保持高效协同,实现项目稳定增长 |社区征文
机器学习10-信念贝叶斯分类器
Qt5 mvc: revealing the secrets of data visualization
[proteus simulation] Arduino UNO +74c922 keyboard decoding drive 4x4 matrix keyboard
那些一门心思研究自动化测试的人,后来怎样了?
PHP数组拼接MySQL的in语句
亲测有效,快速创建JMeter桌面快捷方式
如何学习和阅读代码
Live shopping mall source code, realize left-right linkage of commodity classification pages
TypeError: Argument ‘angle‘ can not be treated as a double
Use of laravel carbon time processing class
Necessary tools for testing - postman practical tutorial
FL Studio20.9水果软件高级中文版电音编曲
视频教程 | 长安链推出系列视频教程合集(入门)