当前位置:网站首页>超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:48:00 【智源社区】
最近,来自北大和微软的研究人员基于自洽的新方法DiVeRSe,包含三个主要的创新点,进一步提升了模型的推理能力。
论文链接:https://arxiv.org/abs/2206.02336
代码链接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的启发,即从语言模型中采样不同的推理路径,DiVeRSe在多样性上更进一步,按照「条条大路通罗马」的理念,使用多个prompt生成答案,能够生成更完整、互补的答案。
第二,在生成推理路径时,语言模型中并不存在一种机制来纠正先前步骤中的错误,可能会导致最终预测结果的混乱。DiVeRSe借鉴verifier的思想,对每个推理路径的正确性进行验证来引导投票机制。也就是说,并非所有的推理机制都是相等重要的或都是好的。
第三,由于答案是基于多个步骤的推理而产生的,当一个路径生成一个正确的答案时,可以认为所有的步骤都对最终的正确性做出了贡献。然而,当生成一个错误的答案时,这并不意味着所有的步骤都是错误的或对错误有贡献。
边栏推荐
- Penetration testing methodology
- Leetcode: Shortest Word Distance II
- 想问下大家伙,有无是从腾讯云MYSQL同步到其他地方的呀?腾讯云MySQL存到COS上的binlog
- Behind the ultra clear image quality of NBA Live Broadcast: an in-depth interpretation of Alibaba cloud video cloud "narrowband HD 2.0" technology
- 如何将电脑复制的内容粘贴进MobaXterm?如何复制粘贴
- 729. 我的日程安排表 I :「模拟」&「线段树(动态开点)」&「分块 + 位运算(分桶)」
- There is a powerful and good-looking language bird editor, which is better than typora and developed by Alibaba
- be careful! Software supply chain security challenges continue to escalate
- How to solve the problem of garbled code when installing dependency through NPM or yarn
- CODING DevSecOps 助力金融企业跑出数字加速度
猜你喜欢
可视化任务编排&拖拉拽 | Scaleph 基于 Apache SeaTunnel的数据集成
Topology visual drawing engine
社区团购撤城“后遗症”
Crud of MySQL
Behind the ultra clear image quality of NBA Live Broadcast: an in-depth interpretation of Alibaba cloud video cloud "narrowband HD 2.0" technology
超级哇塞的快排,你值得学会!
Pointer operation - C language
【NVMe2.0b 14-9】NVMe SR-IOV
Dark horse programmer - software testing -10 stage 2-linux and database -44-57 why learn database, description of database classification relational database, description of Navicat operation data, de
CODING DevSecOps 助力金融企业跑出数字加速度
随机推荐
B站做短视频,学抖音死,学YouTube生?
想进阿里必须啃透的12道MySQL面试题
Photoshop插件-动作相关概念-ActionList-ActionDescriptor-ActionList-动作执行加载调用删除-PS插件开发
How to choose the appropriate certificate brand when applying for code signing certificate?
Select sort and bubble sort
浅谈Dataset和Dataloader在加载数据时如何调用到__getitem__()函数
P1451 求细胞数量/1329:【例8.2】细胞
CPU设计实战-第四章实践任务二用阻塞技术解决相关引发的冲突
FR练习题目---综合题
What about SSL certificate errors? Solutions to common SSL certificate errors in browsers
729. 我的日程安排表 I :「模拟」&「线段树(动态开点)」&「分块 + 位运算(分桶)」
Using tensorboard to visualize the training process in pytoch
CPU design practice - Chapter 4 practice task 3 use pre delivery technology to solve conflicts caused by related issues
华为哈勃化身硬科技IPO收割机
Easyocr character recognition
【C 题集】of Ⅷ
外盘入金都不是对公转吗,那怎么保障安全?
【NVMe2.0b 14-9】NVMe SR-IOV
【leetcode周赛总结】LeetCode第 81 场双周赛(6.25)
可视化任务编排&拖拉拽 | Scaleph 基于 Apache SeaTunnel的数据集成