当前位置:网站首页>【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
2022-08-03 17:02:00 【InfoQ】
1.1技术背景——什么是基于深度学习的文本信息抽取



1.1.1基于深度学习的实体抽取
通常包括两部分:
中文命名实体识别的难点主要存在于:
1.1.2基于深度学习的关系抽取
因此,中文领域的实体关系抽取研究具有较大的挑战性,主要存在3个特殊性:
1.1.3基于深度学习的事件抽取
事件抽取任务可分解为4 个子任务:
相比于模式匹配和传统机器学习的方法,深度学习方法优势明显:
合合信息认为以下几点会是信息抽取技术发展的重要方向:
- Jing Li, Aixin Sun, Jianglei Han, and Chenliang Li,“A Survey on Deep Learning for Named Entity Recognition”, IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, 2020
- Animashree Anandkumar,“Deep Active Learning for Named Entity Recognition” in Proceedings of the 2nd Workshop on Representation Learning for NLP, pages 252–256,
- Arya Roy “Recent Trends in Named Entity Recognition (NER)” arXiv:2101.11420v1 [cs.CL] 25 Jan 2021
- 李冬梅,张扬,李东远,林丹琼 .实体关系抽取方法研究综述[J]. 计算机研究与发展,2020,57(7)
- Yanyao Shen,Hyokun Yun ,Zachary C. Lipton ,Yakov Kronrod and Shantanu Kumar,”A Survey of Deep Learning Methods for Relation Extraction“ arXiv:1705.03645v1 [cs.CL] 10 May 2017
- Qian Li, Jianxin Li, Jiawei Sheng, Shiyao Cui, Jia Wu,Yiming Hei, Hao Peng,Shu Guo, Lihong Wang, Amin Beheshti, and Philip S ,“A Compact Survey on Event Extraction: Approaches and Applications“ IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 14, NO. 9, NOVEMBER 2021
边栏推荐
猜你喜欢

【指针初解】

After using Stream for many years, does collect still have these "saucy operations"?

数字资产的价值激发:NFT 质押

C专家编程 第1章 C:穿越时空的迷雾 1.9 阅读ANSI C标准,寻找乐趣和裨益

JS中对象数组用sort按属性排序
![[Unity Getting Started Plan] Basic Concepts (6) - Sprite Renderer Sprite Renderer](/img/c2/5717cb053bc6c07829a616735cbc71.png)
[Unity Getting Started Plan] Basic Concepts (6) - Sprite Renderer Sprite Renderer

CC2530_ZigBee+华为云IOT:设计一套属于自己的冷链采集系统

自动化部署+整合SSM项目

【Metaverse系列一】元宇宙的奥秘

11. Container With Most Water
随机推荐
Looking at the ecological potential of Hongmeng OS from the evolution of MatePad Pro
面试不再被吊打!这才是Redis分布式锁的七种方案的正确打开方式
sibling component communication context
SwinIR实战:详细记录SwinIR的训练过程
关于oracle表空间在线碎片整理
【无标题】
【GAMES101】作业6 加速结构
中小微企业如何简单便捷、低成本实现数字化?360视觉云有妙招
CC2530_ZigBee+华为云IOT:设计一套属于自己的冷链采集系统
工程仪器设备在线监测管理系统常见问题和注意事项
Huawei, Lenovo, BAIC, etc. were selected as the first batch of training bases for "Enterprise Digital Transformation and Security Capability Improvement" by the Ministry of Industry and Information Te
ICDAR比赛技术分享
为什么我用了Redis之后,系统的性能却没有提升
Detailed explanation of setting HiSilicon MMZ memory and OS memory
LeetCode·899.有序队列·最小表示法
工程仪器设备在线监测管理系统常见问题和注意事项
deepstresam的插件配置说明,通过配置osd,设置字体的背景为透明
C专家编程 第3章 分析C语言的声明 3.1 只有编译器才会喜欢的语法
怎么在opengauss中进行测试自己添加的新函数的性能(循环n次的运行时间)?
双指针/滑动窗口问题