当前位置:网站首页>Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
2022-07-01 01:30:00 【人工智能曾小健】
模型框架
从 ERNIE 1.0 起,百度研究者们就在预训练中引入知识增强学习,通过
掩码连续的词、
phrase、
named entity 等语义知识单元,
实现更好的预训练学习。本次开源的通用语义理解模型 ERNIE-Gram 更进一步,提出的显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
ERNIE 多粒度预训练语义理解技术
作为自然语言处理的基本语义单元,更充分的语言粒度学习能帮助模型实现更强的语义理解能力:
- ERNIE-Gram 提出显式完备的 n-gram 多粒度掩码语言模型,同步建模 n-gram 内部和 n-gram 之间的语义关系,实现同时学习**细粒度(fine-grained)和粗粒度(coarse-grained)**语义信息
- ERNIE-Gram 采用双流结构,在预训练过程中实现了单一位置多语义粒度层次预测,进一步增强了语义知识学习
ERNIE-Gram 多粒度预训练语义理解技术,在预训练 (pre-training) 阶段实现了显式的多粒度语义信号学习,在微调 (fine-tuning) 阶段采用 bert-style 微调方式,在不增加参数和计算复杂度的前提下,取得 10 项英文权威任务的 SOTA。在中文任务上,ERNIE-Gram 在包括 NLI、阅读理解等需要丰富、多层次的语义理解任务上取得公开 SOTA。
ERNIE-Gram 工作已被 NAACL-HLT 2021 作为长文收录,更多细节见 link。

ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding
边栏推荐
- [simulation] 922 Sort Array By Parity II
- 小程序云开发之--微信公众号文章采集篇
- Some essential differences
- Handsontable數據網格組件
- Laravel+redis generates an order number - automatically increase from 1 on the same day
- C#生成putty格式的ppk文件(支持passphrase)
- Creating ASCII art with C #
- TypeError: Argument ‘angle‘ can not be treated as a double
- Composants de la grille de données portatifs
- 【agora】用户管理
猜你喜欢

FL Studio20.9水果软件高级中文版电音编曲

QML控件类型:ToolTip

Selenium classic interview question - multi window switching solution

In the fourth week of June, the list - flying melon data up main growth ranking list (BiliBili platform) was released!

医疗HIS行业短信发送解决方案

How does ZABBIX configure alarm SMS? (alert SMS notification setting process)

修复表中的名字(首字符大写,其他小写)

The whole process of AS400 API from zero to one

CorelDRAW 2022中文精简64位直装版下载

思特奇加入openGauss开源社区,共同推动数据库产业生态发展
随机推荐
TypeError: can‘t convert cuda:0 device type tensor to numpy. Use Tensor. cpu() to copy the tensor to
[Qt5 tab] tab label and content hierarchical analysis
Live shopping mall source code, realize left-right linkage of commodity classification pages
7-2 punch in reward DP for puzzle a
Analysis on user behavior loss of data exploration e-commerce platform
AS400 大廠面試
[stack] 921 Minimum Add to Make Parentheses Valid
Log4j2 ThreadContext日志链路追踪
Handsontable数据网格组件
SQL语句关联表 如何添加关联表的条件 [需要null值或不需要null值]
那些一门心思研究自动化测试的人,后来怎样了?
[fundamentals of wireless communication-15]: illustrated mobile communication technology and application development-3-overview of digital communication 2G GSM, CDMA, 3G wdcma/cdma200/td-scdma, 4G LTE
工作6年,来盘点一下职场人混迹职场的黄金法则
There is no future to be expected. It is just the last fantasy of a migrant worker before he dies
Some items of OCR
Electron pit Addon
Some essential differences
Laravel event & Monitoring
MYSQL 数据库查看磁盘占用情况
Composants de la grille de données portatifs