当前位置:网站首页>Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
2022-07-29 15:58:00 【人工智能曾小健】
模型框架
从 ERNIE 1.0 起,百度研究者们就在预训练中引入知识增强学习,通过
掩码连续的词、
phrase、
named entity 等语义知识单元,
实现更好的预训练学习。本次开源的通用语义理解模型 ERNIE-Gram 更进一步,提出的显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
ERNIE 多粒度预训练语义理解技术
作为自然语言处理的基本语义单元,更充分的语言粒度学习能帮助模型实现更强的语义理解能力:
- ERNIE-Gram 提出显式完备的 n-gram 多粒度掩码语言模型,同步建模 n-gram 内部和 n-gram 之间的语义关系,实现同时学习**细粒度(fine-grained)和粗粒度(coarse-grained)**语义信息
- ERNIE-Gram 采用双流结构,在预训练过程中实现了单一位置多语义粒度层次预测,进一步增强了语义知识学习
ERNIE-Gram 多粒度预训练语义理解技术,在预训练 (pre-training) 阶段实现了显式的多粒度语义信号学习,在微调 (fine-tuning) 阶段采用 bert-style 微调方式,在不增加参数和计算复杂度的前提下,取得 10 项英文权威任务的 SOTA。在中文任务上,ERNIE-Gram 在包括 NLI、阅读理解等需要丰富、多层次的语义理解任务上取得公开 SOTA。
ERNIE-Gram 工作已被 NAACL-HLT 2021 作为长文收录,更多细节见 link。

ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding
边栏推荐
- 58安全-图像质量评价技术实践
- 3分钟带你了解微信小程序开发
- 地平线获得舜宇集团战略投资并与舜宇智领签署战略合作协议
- 中小型金融企业该如何进行灾备建设?
- 【微信小程序】组件使用及属性参考
- Hystri基本介绍和代码简单实现
- [Server Storage Data Recovery] A data recovery case of a RAID 5 crash caused by the failure of a certain model of Huawei OceanStor storage RAID 5 hard disk and the failure to synchronize data with the
- 驱动领域DDD的微服务设计和开发实战
- 【小程序项目开发-- 京东商城】uni-app之商品列表页面 (上)
- 召回 i2i
猜你喜欢

【Swoole系列3.2】Swoole 异步进程服务系统

一文读懂Elephant Swap,为何为ePLATO带来如此高的溢价?

金九银十必备 快来看看你还缺啥

Flutter动态化 | Fair 2.6.0 新版本特性

【服务器存储数据恢复】华为OceanStor某型号存储raid5硬盘故障离线,热备盘同步数据失败导致raid崩溃的数据恢复案例

【PCL学习笔记】点云处理常用的库和API(PCL库+Eigen)

Google Play 政策更新 | 2022 年 7 月

中国大学慕课mooc答题/自动播放脚本(domooc)使用教程

This article penetrates the architecture design and cluster construction of the distributed storage system Ceph (hands-on)

显微镜LED补光可调光源
随机推荐
uni-app进阶之Weex/nvu
召回 i2i
uni-app判断平台开发环境和生产环境
虚拟远程桌面
Recommended Remote Desktop Tools
微信公众号借助小程序云函数实现支付功能
【服务器存储数据恢复】华为OceanStor某型号存储raid5硬盘故障离线,热备盘同步数据失败导致raid崩溃的数据恢复案例
支持百亿请求的微博广告运维技术实践
SQL 开始日期、结束日期查询
uni-app深入学习之模板运用
#夏日挑战赛# HarmonyOS - 实现签名功能
[PCL study notes] Commonly used libraries and APIs for point cloud processing (PCL library Eigen)
Twin all things digital visual | join the real world and the digital space
leetcode:1901. 寻找峰值 II【二分找矩阵局部最大】
ByteArrayOutputStream 类源码分析
Moving forward steadily without forgetting the original intention, Volvo's sense of security comes from the public's recognition
一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)
Talking about the memory layout of the program
MySQL外键约束怎么创建
上海移动基于亚信科技AntDB完成核心账务数据库的国产化替换