当前位置:网站首页>论文阅读_ICD编码_MSMN
论文阅读_ICD编码_MSMN
2022-07-03 04:39:00 【xieyan0811】
介绍
英文题目:Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding
中文题目:自动ICD编码的同义词匹配网络
论文地址:https://export.arxiv.org/pdf/2203.01515.pdf
领域:自然语言处理、生物医疗
发表时间:2022
作者:Zheng Yuan等,清华大学,阿里巴巴
出处:ACL
代码和数据: https://github.com/GanjinZero/ICD-MSMN
阅读时间:2022.06.14
读后感
通过代入外部资源UMLS,论文收集了每个编码的同义词,从而弥补了电子病历与ICD编码描述中同义不同词的问题。
其算法并没有像之前一些模型那么精巧,但引入外部资源后,效果的确提升不少。
泛读
- 针对问题:ICD编码中一义多词问题
- 核心方法:
- 提出了多同义词匹配网络 (MSMN)
- 使用LSTM+多头注意力
- 将编码的同义词作为query以关注描述中的不同短语,从而生成与ICD编码相关的表示。
- 使用双仿射的ICD编码相似度的文本表示,用于最终分类。
- 泛读后理解程度:
- 半小时看完,半小时整理(这是一篇短文)
方法
ICD编码同义词
使用UMLS(一体化医学语言系统)知识图,对ICD编码描述进行扩展,首先,将代码描述l1与UMLS中的概念唯一标识符CUIs对齐;然后从UMLS中选择具有相同CUIs的英语术语同义词,并通过删除连字符和单词“NOS”来添加额外的同义词。从而对每个ICD编码生成 {l2,l3…lM} 文本,下面用N表示每个描述包含的单词个数。
编码
使用LSTM作为编码器,利用预训练的词向量将词wi映射成xi,使用d层的双向LSTM,将词嵌入作为输入,计算其隐藏层作为表示。
对同义词编码时,使用同样的编码器编码,然后用最大池化获取其表示:

多同义词注意力
受多头注意力的启发,文中使用了多同义词注意力,将隐藏层切分成M块(M头):

此时,使用编码同义词的表示qj来查询Hj,用Hj和qj的线性变换来计算注意力得分a;文本与代码同义词的相关编码可用Ha求得。聚合基于编码的文本表示v,当只需要与一个编码匹配时,使用

分类器
分类器用于判断文本S是否包含ICD编码l,基于前面计算的依赖编码的文本表示vl和编码的表示qj,使用双仿射变换来衡量分类的相似性。

之前很多模型只依赖编码,因此需要训练集中包含每种编码的实例,而这里的q是基于编码的文本表示,因此,学习的是文本之间的关系,与具体的代码无关。
训练
用交叉熵来计算预测概率与实际标签的差异:

边栏推荐
- 带有注意力RPN和多关系检测器的小样本目标检测网络(提供源码和数据及下载)...
- 会员积分商城系统的功能介绍
- After job hopping at the end of the year, I interviewed more than 30 companies in two weeks and finally landed
- 【SQL注入点】注入点出现位置、判断
- FuncS sh file not found when using the benchmarksql tool to test kingbases
- 金仓KFS数据双向同步场景部署
- How to use kotlin to improve productivity: kotlin tips
- What functions need to be set after the mall system is built
- Jincang KFS data bidirectional synchronization scenario deployment
- Dive into deep learning - 2.1 data operation & Exercise
猜你喜欢

Introduction of pointer variables in function parameters

GFS distributed file system (it's nice to meet it alone)

stm32逆向入门

Number of uniform strings of leetcode simple problem

Internationalization and localization, dark mode and dark mode in compose

Library management system based on SSM

使用BENCHMARKSQL工具对kingbaseES执行灌数据提示无法找到JDBC driver

The programmer went to bed at 12 o'clock in the middle of the night, and the leader angrily scolded: go to bed so early, you are very good at keeping fit

Two drawing interfaces - 1 Matlab style interface

FISCO bcos zero knowledge proof Fiat Shamir instance source code
随机推荐
[PCL self study: filtering] introduction and use of various filters in PCL (continuously updated)
2022-02-12 (338. Bit count)
Integration of Android high-frequency interview questions (including reference answers)
Joint set search: merge intervals and ask whether two numbers are in the same set
I stepped on a foundation pit today
Mount NFS in kubesphere
一名外包仔的2022年中总结
Youdao cloud notes
MediaTek 2023 IC written examination approved in advance (topic)
2022 a special equipment related management (elevator) analysis and a special equipment related management (elevator) simulation test
Dive Into Deep Learning——2.1数据操作&&练习
2022 registration of G2 utility boiler stoker examination and G2 utility boiler stoker reexamination examination
Contents of welder (primary) examination and welder (primary) examination in 2022
Pyqt control part (II)
JS multidimensional array to one-dimensional array
2022-02-14 (394. String decoding)
文献阅读_基于多模态数据语义融合的旅游在线评论有用性识别研究(中文文献)
IPhone x forgot the boot password
跨境电商多商户系统怎么选
Leetcode simple problem delete an element to strictly increment the array