当前位置:网站首页>Re19:读论文 Paragraph-level Rationale Extraction through Regularization: A case study on European Court
Re19:读论文 Paragraph-level Rationale Extraction through Regularization: A case study on European Court
2022-07-30 09:15:00 【诸神缄默不语】
论文名称:Paragraph-level Rationale Extraction through Regularization: A case study on European Court of Human Rights Cases
论文ArXiv下载地址:https://arxiv.org/abs/2103.13084
论文NAACL官方下载地址:https://aclanthology.org/2021.naacl-main.22/(有官方视频。本博文中非来自论文的插图都截取自该视频)
本文提出的ECtHR数据集的huggingface下载地址:ecthr_cases · Datasets at Hugging Face
本文是2021年NAACL论文。
任务:alleged violation prediction预测事实描述文本对应违反的法条(highly skewed multi-label text classification task)+可解释性(rationale extraction)
rationale extraction:提取案例文本中用于为预测结果提供解释的段落(paragraph-level)
为了提高alleged violation prediction任务中的可解释性(interpretability或explainablity),从用户中心的角度出发对决策结果提供合理的解释。本文通过rationale extraction来实现这一目标,以前的主流方法都集中在word-level rationales,而本文是从multi-paragraph structured court cases中抽取自然段。除此之外,本文还提出了一个有标注rationales的数据集ECtHR。本文使用了已有的rationale constraints( sparsity, continuity, and comprehensiveness),并新提出了singularity,作为regularizers。
1. Background
- rationalization by construction方法论:直接用constraint来正则化模型,对模型决策基于正确rationales的情况给与reward,而非事后根据模型决策结果推理可解释性
the model is regularized to satisfy additional constraints that reward the model, if its decisions are based on concise rationales it selects, as opposed to inferring explanations from the model’s decisions in a post-hoc manner - 可解释性的意义:right to explanation
- 执法过程:
2. 模型
2.1 Novelty
- previous work on word-level rationales for binary classification→paragraph-level rationales
- 第一个在端到端微调预训练Transformer模型中应用rationale extraction的工作
- 不需要人工标注的rationales
2.2 模型
constraint:以前就有的sparsity, continuity(实验证明无效), and comprehensiveness(需要根据multi-label范式进行修正),本文新提出的singularity(能提升效果,而且鲁棒)
baseline HIERBERT-HA:text encoder→rationale extraction→prediction
在视频中放的图是:
词级别的正则器
①分别编码每个段落:context-unaware paragraph representations
②用2层transformer编码contextualized paragraph embeddings
③全连接层(激活函数selu)
K→用于分类
Q→用于rationale extraction→每个段落分别过全连接层+sigmoid,得到soft attention
scores→binarize,得到hard attention scores
④得到hardmasked document representation(hard mask+max pooling)(不可微,所以有一个训练trick)
⑤全连接层+sigmoid
baseline HIERBERT-ALL:不mask事实
constraint:
①Sparsity:限制选择出的事实的数目
②Continuity:于本文模型无用,但还是实验了
③Comprehensiveness:留下的段落生成的结果比扔掉的要好多少,或者比较两种段落的余弦相似度
④Singularity:选出的mask比随机的要好
Rationales supervision:noisy rationale supervision
3. 实验
3.1 数据集
提出ECtHR数据集,英语案例文本,silver/gold rationales,事件有时间顺序,决策包括违背的法条和援引的先例
3.2 实验设置
超参数:
网格搜索,Adam,学习率2e-5
贪心调参
LEGAL-BERT-SMALL:
50 paragraphs of 256 words
3.3 实验结果
指标:
micro-F1
Faithfulness: sufficiency and comprehensiveness
Rationale quality: Objective / subjective (mean R-Precision (mRP) [email protected])
4. 代码复现
等我服务器好了再说。
边栏推荐
- leetcode 剑指 Offer 63. 股票的最大利润
- conda 导出/导出配置好的虚拟环境
- Access to display the data
- leetcode 剑指 Offer 46. 把数字翻译成字符串
- 判断一颗树是否为完全二叉树——视频讲解!!!
- 编译报错: undefined reference to `google::FlagRegisterer::FlagRegisterer解决方法
- Unified exception handling causes ResponseBodyAdvice to fail
- (***重点***)Flink常见内存问题及调优指南(一)
- 【 HMS core 】 【 】 the FAQ HMS Toolkit collection of typical questions 1
- 实施敏捷过程中这些常见的问题你可曾遇到?
猜你喜欢
随机推荐
实战演练 | 在 MySQL 中计算每日平均日期或时间间隔
Apache DolphinScheduler新一代分布式工作流任务调度平台实战-上
快解析结合任我行crm
C语言顺序表基本操作
leetcode 剑指 Offer 22. 链表中倒数第k个节点
激活数据潜力 亚马逊云科技重塑云上存储“全家桶”
2022/07/29 Study Notes (day19) Exception Handling
HR团队如何提升效率?人力资源RPA给你答案
Shell系统学习之函数
The use of qsort function and its analog implementation
Integral Topic Notes - Path Independent Conditions
Detailed description of iperf3 parameter options
无法定位程序输入点ucrtbase.abort于动态链接库api-ms-win-crt-runtime-|1-1-0.dll上
Day113.尚医通:微信登录二维码、登录回调接口
柱状图 直方图 条形图 的区别
(文字)无框按钮设置
团队级敏捷真的没你想的那么简单
快解析结合友加畅捷通t1飞跃版
Re18: Read the paper GCI Everything Has a Cause: Leveraging Causal Inference in Legal Text Analysis
百度推广助手遇到重复关键字,验证错误,怎么一键删除多余的