当前位置:网站首页>【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
2022-08-03 17:02:00 【InfoQ】
1.1技术背景——什么是基于深度学习的文本信息抽取



1.1.1基于深度学习的实体抽取
通常包括两部分:
中文命名实体识别的难点主要存在于:
1.1.2基于深度学习的关系抽取
因此,中文领域的实体关系抽取研究具有较大的挑战性,主要存在3个特殊性:
1.1.3基于深度学习的事件抽取
事件抽取任务可分解为4 个子任务:
相比于模式匹配和传统机器学习的方法,深度学习方法优势明显:
合合信息认为以下几点会是信息抽取技术发展的重要方向:
- Jing Li, Aixin Sun, Jianglei Han, and Chenliang Li,“A Survey on Deep Learning for Named Entity Recognition”, IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, 2020
- Animashree Anandkumar,“Deep Active Learning for Named Entity Recognition” in Proceedings of the 2nd Workshop on Representation Learning for NLP, pages 252–256,
- Arya Roy “Recent Trends in Named Entity Recognition (NER)” arXiv:2101.11420v1 [cs.CL] 25 Jan 2021
- 李冬梅,张扬,李东远,林丹琼 .实体关系抽取方法研究综述[J]. 计算机研究与发展,2020,57(7)
- Yanyao Shen,Hyokun Yun ,Zachary C. Lipton ,Yakov Kronrod and Shantanu Kumar,”A Survey of Deep Learning Methods for Relation Extraction“ arXiv:1705.03645v1 [cs.CL] 10 May 2017
- Qian Li, Jianxin Li, Jiawei Sheng, Shiyao Cui, Jia Wu,Yiming Hei, Hao Peng,Shu Guo, Lihong Wang, Amin Beheshti, and Philip S ,“A Compact Survey on Event Extraction: Approaches and Applications“ IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 14, NO. 9, NOVEMBER 2021
边栏推荐
- C专家编程 第3章 分析C语言的声明 3.9 轻松一下---驱动物理实体的软件
- 广告电商系统开发之会员系统板块
- 大佬们。使用flink-cdc-sqlserver 2.2.0 版本读取sqlserver2008R
- C专家编程 第2章 这不是Bug,而是语言特性 2.1 这关语言特性何事,在Fortran里这就是Bug呀
- phoenix创建映射表和创建索引、删除索引
- 高效的组织信息共享知识库是一种宝贵的资源
- How to write SQL statements in DataWorks monitoring data reaches a certain value to indicate the change of
- 使用deepstream消息发送功能的时候,检测框没有检测标签,No text labels of bboxes displayed with osd for deepstream-test5
- C专家编程 第3章 分析C语言的声明 3.7 typedef struct foo{... foo;}的含义
- 被误解的 MVC 和被神化的 MVVM(二)
猜你喜欢

TiKV & TiFlash 加速复杂业务查询丨TiFlash 应用实践

J9数字虚拟论:元宇宙的潜力:一股推动社会进步的力量

JS 字符串转 GBK 编码超精简实现

面试不再被吊打!这才是Redis分布式锁的七种方案的正确打开方式

C语言02、语句、函数

Components of communication - the drop-down menu
![[Unity Getting Started Plan] Basic Concepts (6) - Sprite Renderer Sprite Renderer](/img/c2/5717cb053bc6c07829a616735cbc71.png)
[Unity Getting Started Plan] Basic Concepts (6) - Sprite Renderer Sprite Renderer

ORACLE CLOUD 在国内有数据中心吗?

面试突击71:GET 和 POST 有什么区别?

【Metaverse系列一】元宇宙的奥秘
随机推荐
C语言01、数据类型、变量常量、字符串、转义字符、注释
软考 --- 软件工程(1)概念、开发模型
C专家编程 第1章 C:穿越时空的迷雾 1.9 阅读ANSI C标准,寻找乐趣和裨益
TiKV & TiFlash 加速复杂业务查询丨TiFlash 应用实践
关于oracle表空间在线碎片整理
微信小程序 - 数组 push / unshift 追加后数组返回内容为数字(数组添加后打印结果为 Number 数值类型)
102. 最佳牛围栏
学会 Arthas,让你 3 年经验掌握 5 年功力!
为什么我用了Redis之后,系统的性能却没有提升
论文解读(JKnet)《Representation Learning on Graphs with Jumping Knowledge Networks》
How ArkUI adapter somehow the screen
J9数字虚拟论:元宇宙的潜力:一股推动社会进步的力量
[Unity Starter Plan] Making RubyAdventure01 - Player Creation & Movement
How to write SQL statements in DataWorks monitoring data reaches a certain value to indicate the change of
数字资产的价值激发:NFT 质押
数据万象内容审核 — 共建安全互联网,专项开展“清朗”直播整治行动
Promise的 简单使用
sphinx error connection to 127.0.0.1:9312 failed (errno=0, msg=)
Which thread pool does Async use?
虹科分享 | 如何测试与验证复杂的FPGA设计(3)——硬件测试