当前位置:网站首页>BERT为何无法彻底干掉BM25??
BERT为何无法彻底干掉BM25??
2022-06-28 13:27:00 【智源社区】
近些年来,相比传统检索模型,大规模预训练式transformers结构的引入在各类任务上都有显著的提升。而这种提升在不同的数据集上有着特殊的模型设置,而当前依旧无法充分理解这些模型为什么以及如何可以更好的工作。
古人云:知己知彼,方能百战不殆。而现在的NN模型尚不能做到知己,又怎么进行下一步的升级迭代呢?今天让我们来看一下信息检索任务上,基于Bert的交叉编码器相比传统的BM25排序算法的异同有哪些呢?

论文题目:
How Different are Pre-trained Transformers for Text Ranking?
论文链接:
https://arxiv.org/abs/2204.07233
与传统的基于词的方法(如BM25或Query-Likelihood)相比,神经信息检索最近经历了令人印象深刻的性能提升。
由于诸如BERT这类模型具有大量参数,所以它能处理具有长范围依赖和复杂的句子结构。
当将BERT应用于排序时,它可以在query和doc之间构建深度交互,从而允许揭示复杂的关联模式,而不仅仅是简单的term匹配。
到目前为止,BERT交叉编码器所取得的巨大性能增益并没有被很好地解释。
我们对BERT模型到底是基于何种特征来用于计算句子相关性的匹配原则以及使用该模型的排序结果与BM25等传统稀疏排序算法的关系知之甚少。
BERT通过query和doc之间的术语交互直接捕获相关性信号,本文对BERT的交叉编码器(Cross-Encode,下文简称CE)与BM25的排序算法有何联系做一些研究。
首先提出以下几个问题:
RQ1: CE和BM25到底有和不同?
RQ1.2: CE是否对BM25检索到的相同结果进行了更好的排序?
RQ1.3: CE能更好地召回被BM25遗漏的结果吗?
其次,分别量化精确匹配和软匹配对整体效果的贡献,因为它们构成了传统稀疏检索和神经检索匹配范式之间最直接的对比。更具体地说,需要明确以下问题:
RQ2: CE是否能体现term完全匹配?
RQ3: CE能找到“不可能相关”的结果吗?
边栏推荐
- yii2编写swoole的websocket服务
- How to solve the problem that the computer wireless network does not display the network list
- Which company has a low rate for opening a securities account? How to open an account is the safest
- Setup and upload of arduino-esp32 flash file plug-in program
- Solution to directory access of thinkphp6 multi-level controller
- MySQL multi table joint query
- Jerry's wif interferes with Bluetooth [chapter]
- (原创)【MAUI】一步一步实现“悬浮操作按钮”(FAB,Floating Action Button)
- Professional English calendar questions
- Oracle 云基础设施扩展分布式云服务,为组织提供更高的灵活性和可控性
猜你喜欢

895. longest ascending subsequence

行动诠释价值,城联优品韩董事长出席广东英德抗洪捐赠公益活动会

Embedded development: seven techniques for estimating battery life

China Radio and television 5g package is coming, lower than the three major operators, but not as low as expected

Pytorch Foundation

ShareIt has outstanding strength and landed in the top 7 of the global IAP strength list

求职简历的书写技巧

MySQL multi table joint query

5A同步整流芯片 20V转12V2A/5V4.5A大电流 24W大功率同步整流芯片 大电流降压IC FS2462

Latest summary! 30 provinces announce 2022 college entrance examination scores
随机推荐
Class structure in C language - dot
Align content attribute in flex layout
中国数据库技术大会(DTCC)特邀科蓝SUNDB数据库专家精彩分享
移动Web实训DAY-1
Zhongang mining focuses on the fluorine chemical industry and lays out the new energy industry chain
Pytorch main modules
China Database Technology Conference (DTCC) specially invited experts from Kelan sundb database to share
ThreadLocal的简单理解
Introduction to PWN (1) binary Basics
Arduino-ESP32闪存文件插件程序搭建和上传
Notes on the use of official jeecg components (under update...)
Pytorch model
Google Earth engine (GEE) - Global organic soil area of FAO (1992-2018)
StackOverflow 2022数据库年度调查
China Radio and television 5g package is coming, lower than the three major operators, but not as low as expected
股票网上开户及开户流程怎样?手机开户是安全么?
Setup and upload of arduino-esp32 flash file plug-in program
Action interprets value. The chairman of chenglian Youpin Han attended the Guangdong Yingde flood fighting donation public welfare event
From PDB source code to frame frame object
[机缘参悟-32]:鬼谷子-抵巇[xī]篇-面对危险与问题的五种态度