当前位置:网站首页>又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队
又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队
2022-06-30 16:43:00 【计算机视觉研究院】
关注并星标
从此不迷路
计算机视觉研究院



公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
作者:Edison_G
「他们并不是照抄文本,而是剽窃想法。」
转自《机器之心》
01
概述
昨天,有人在 reddit 上发帖称,IBM 苏黎世研究中心剽窃了自己的论文,而且还被 CVPR 2022 接收了。
这位发帖者写道:
我叫 Xianbiao Qi,是一位有十多年研究经验的计算机视觉研究者。我写这个博客是为了投诉一个严重的案例:IBM 苏黎世研究中心的员工蓄意剽窃我们的论文。他们并不是照抄文本,而是剽窃想法。
Qi 提到的疑似被抄袭的论文题为「PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML(平安 VCGroup 为 ICDAR 2021 科学文献解析竞赛任务 B 提供的解决方案:HTML 表格识别)」,作者来自平安保险和平安科技,上传 arXiv 的时间是 2021 年 5 月份,2021 年 7 月份公布了代码,2021 年 9 月发布了 Tablemaster 预训练模型,2021 年 11 月发布了 tablemaster_mmocr docker 环境。论文中提到的竞赛是 2021 年 4 月结束的,由 IBM 的另一个团队主办。

论文链接:https://arxiv.org/pdf/2105.01848.pdf
如论文标题所述,这篇文章为 ICDAR 2021 科学文献解析竞赛任务 B(HTML 表格识别)提供了一套解决方案。具体来说,他们将表格内容识别分为四个子任务:表格结构识别、文本行检测、文本行识别和框分配。表格结构识别算法是基于一种鲁棒的图像文本识别算法 MASTER 定制的。PSENet 用于检测表图像中的每个文本行。文本行识别模型也建立在 MASTER 之上。最后,在框分配阶段,他们将 PSENet 检测到的文本框与通过表结构预测重构的结构项相关联,并将文本行的可识别内容填充到对应项中。

被指抄袭的 IBM 论文题为「TableFormer: Table Structure Understanding with Transformers(TableFormer:用 Transformer 理解表结构)」,上传 arXiv 的时间是 2022 年 3 月份,提交给 CVPR 的时间未知。

论文链接:https://arxiv.org/pdf/2203.01017.pdf

在这篇论文中,IBM 的研究人员提出了一种新的表结构识别模型,它从两个方面改进了最新的端到端深度学习模型(即来自 PubTabNet 的 encoder-dual-decoder)。首先,他们引入了一种新的目标检测解码器用于表格单元格。通过这种方式,他们可以直接从 PDF 源中获取编程式 PDF 的表格单元格内容,从而避免了定制 OCR 解码器的训练。这种架构上的改变带来了更精确的表格内容提取。其次,他们将 LSTM 解码器替换为基于 transformer 的解码器。
Qi 表示,IBM 的这篇论文剽窃了他们的方法论、预处理、后处理、可视效果、推理、系统级解决方案、代码、预训练模型等内容,但「为了不被抓住」,他们没有引用 Qi 等人的论文。

接下来,Qi 用十几张图展示了他认为 IBM 存在抄袭的地方。

Qi 展示的疑似抄袭点 1:方法论。他认为,IBM 的研究者抄袭了他们的想法,并重写了「贡献」部分,而且根据他们的图重新画了结构图。

Qi 展示的疑似抄袭点 2:预处理。

Qi 展示的疑似抄袭点 3:后处理。

Qi 展示的疑似抄袭点 4:推理加速方法

Qi 展示的疑似抄袭点 5:技巧。

Qi 展示的疑似抄袭点 6:文本行检测和文本行识别。

Qi 展示的疑似抄袭点 7:系统级解决方案。

Qi 展示的疑似抄袭点 8:可视效果。

Qi 展示的疑似抄袭点 9:误导读者。
在看了 Qi 给出的示例后,有人认为这些都是非常有力的证据,IBM 团队很难证明自己的论文是原创的,Qi 应该向 CVPR 程序委员会投诉。

不过,也有人认为,这些证据不够有力:「两个小组研究的是同一个问题,使用的是相同的公开数据,他们的解决方案也有相似之处。但这并不意味着一方照搬另一方。例如「疑似抄袭点 1」中所展示的内容就不是那么接近」。

目前,我们还没有在帖子下方看到 IBM 论文作者的回应。
不过,值得一提的是,这并不是今年 CVPR 曝出的唯一一件疑似抄袭事件。几天前,一位网友在 YouTube 上爆料说,首尔大学的一篇论文抄袭了十几篇其他论文,目前该论文作者已经出来道歉并撤稿。
或许,顶会论文在查重上面需要多下点功夫了。
参考链接:https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/
THE END
转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
VX:2311123606

往期推荐
边栏推荐
- [sword finger offer] sword finger offer 53 - ii Missing numbers from 0 to n-1
- Thinking on large file processing (upload, download)
- Three methods of modifying time zone in MySQL
- 【义修换届大礼包】
- [bjdctf2020]the mystery of ip|[ciscn2019 southeast China division]web11|ssti injection
- ASP. Net generate verification code
- MIT science and Technology Review released the list of innovators under the age of 35 in 2022, including alphafold authors, etc
- 应届生毕业之后先就业还是先择业?
- 阿里云ECS导入本地,解决部署的问题
- Type ~ storage ~ variable in C #
猜你喜欢

If you want to learn software testing, you must see series, 2022 software testing engineer's career development

Word中添加代码块(转载)
![Ten thousand volumes - list sorting [01]](/img/d4/124101b919a4d8163a32fc0f158efa.png)
Ten thousand volumes - list sorting [01]

港科大&MSRA新研究:关于图像到图像转换,Finetuning is all you need

Php8.0 environment detailed installation tutorial

大文件处理(上传,下载)思考

Development: how to install offline MySQL in Linux system?

vue3 响应式数据库—— reactive

Redis (VI) - master-slave replication

ASP. Net password encryption and password login
随机推荐
Building a basic buildreoot file system
Daily interview 1 question - basic interview question of blue team - emergency response (1) basic idea process of emergency response +windows intrusion screening idea
MIT科技评论2022年35岁以下创新者名单发布,含AlphaFold作者等
4 years of working experience, and you can't tell the five communication modes between multithreads. Can you believe it?
Customer relationship CRM management system based on SSH
Daily interview 1 question - how to prevent CDN protection from being bypassed
ASP. Net password encryption and password login
Nft: unlimited possibilities to open the era of encryption Art
Unity开发bug记录100例子(第1例)——打包后shader失效或者bug
港科大&MSRA新研究:关于图像到图像转换,Finetuning is all you need
Redis (IX) - enterprise level solution (II)
uni-app进阶之内嵌应用【day14】
Ardunio esp32 obtains real-time temperature and humidity in mqtt protocol (DH11)
leetcode:787. The cheapest transfer flight in station K [k-step shortest path + DFS memory + defaultdict (dict)]
K-line diagram interpretation and practical application skills (see position entry)
The gates of Europe
腾讯持久化框架MMKV原理探究
Vue3 reactive database
Design and principle of tubes responsive data system
Dropout: immediate deactivation