当前位置:网站首页>Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
2022-07-29 15:58:00 【人工智能曾小健】
模型框架
从 ERNIE 1.0 起,百度研究者们就在预训练中引入知识增强学习,通过
掩码连续的词、
phrase、
named entity 等语义知识单元,
实现更好的预训练学习。本次开源的通用语义理解模型 ERNIE-Gram 更进一步,提出的显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
ERNIE 多粒度预训练语义理解技术
作为自然语言处理的基本语义单元,更充分的语言粒度学习能帮助模型实现更强的语义理解能力:
- ERNIE-Gram 提出显式完备的 n-gram 多粒度掩码语言模型,同步建模 n-gram 内部和 n-gram 之间的语义关系,实现同时学习**细粒度(fine-grained)和粗粒度(coarse-grained)**语义信息
- ERNIE-Gram 采用双流结构,在预训练过程中实现了单一位置多语义粒度层次预测,进一步增强了语义知识学习
ERNIE-Gram 多粒度预训练语义理解技术,在预训练 (pre-training) 阶段实现了显式的多粒度语义信号学习,在微调 (fine-tuning) 阶段采用 bert-style 微调方式,在不增加参数和计算复杂度的前提下,取得 10 项英文权威任务的 SOTA。在中文任务上,ERNIE-Gram 在包括 NLI、阅读理解等需要丰富、多层次的语义理解任务上取得公开 SOTA。
ERNIE-Gram 工作已被 NAACL-HLT 2021 作为长文收录,更多细节见 link。

ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding
边栏推荐
- 动态规划 爬楼梯
- 驱动领域DDD的微服务设计和开发实战
- 旭硝子龟尾工厂3月起将减少30%玻璃基板供应!TCL华星、友达、群创、惠科均受影响
- 官宣,又一上市公司杀入数据库市场
- 如何破坏单例?我说了好几种方式,面试官:没想到你真会
- Qt笔记-利用QAxObject将文件夹内的所有docx转pdf
- 中芯国际:禁令后全力自救,设备等待期拉长,但没有客户“离开”
- 6月阿里遭拒,90天深造357页微服务手册,获京东offer
- Easy Genes: Human tRNA loci exhibit DNA hypermethylation associated with aging | Research Article
- 揭秘 | 2019 To B 年度盛宴那些人和那些事
猜你喜欢
随机推荐
环球晶圆成功以43.5亿欧元获得Siltronic控股权
地平线获得舜宇集团战略投资并与舜宇智领签署战略合作协议
Twin all things digital visual | join the real world and the digital space
【翻译】设备管理器—英特尔网卡属性设置高级选项的功能
SQL 开始日期、结束日期查询
[Server Storage Data Recovery] A data recovery case of a RAID 5 crash caused by the failure of a certain model of Huawei OceanStor storage RAID 5 hard disk and the failure to synchronize data with the
Win11 最新补丁更新破坏了任务栏中的“开始”菜单
Kubernetes 的 5 个误区
如何写好设计文档
BUUCTF——MISC(流量分析)
易基因:人类tRNA基因位点表现出与衰老相关的DNA高甲基化|研究文章
LG卷轴屏手机曝光;三星屏下摄像头新机曝光
任正非:华为绝不会出售终端手机业务!
Staggered question explanation
中小型金融企业该如何进行灾备建设?
浅谈程序的内存布局
蚂蚁三面滑铁卢!遭分布式截胡,靠这些笔记潜修 30 天,挺进京东
718. 最长重复子数组
传输层 TCP的连接管理-释放连接四次握手
店铺信息管理系统









