当前位置:网站首页>超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:48:00 【智源社区】
最近,来自北大和微软的研究人员基于自洽的新方法DiVeRSe,包含三个主要的创新点,进一步提升了模型的推理能力。

论文链接:https://arxiv.org/abs/2206.02336
代码链接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的启发,即从语言模型中采样不同的推理路径,DiVeRSe在多样性上更进一步,按照「条条大路通罗马」的理念,使用多个prompt生成答案,能够生成更完整、互补的答案。
第二,在生成推理路径时,语言模型中并不存在一种机制来纠正先前步骤中的错误,可能会导致最终预测结果的混乱。DiVeRSe借鉴verifier的思想,对每个推理路径的正确性进行验证来引导投票机制。也就是说,并非所有的推理机制都是相等重要的或都是好的。
第三,由于答案是基于多个步骤的推理而产生的,当一个路径生成一个正确的答案时,可以认为所有的步骤都对最终的正确性做出了贡献。然而,当生成一个错误的答案时,这并不意味着所有的步骤都是错误的或对错误有贡献。
边栏推荐
- 裁员下的上海
- 外盘入金都不是对公转吗,那怎么保障安全?
- Penetration testing methodology
- 【NVMe2.0b 14-9】NVMe SR-IOV
- [12 classic written questions of array and advanced pointer] these questions meet all your illusions about array and pointer, come on!
- JS bright blind your eyes date selector
- Long list optimized virtual scrolling
- NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读
- 【招聘岗位】软件工程师(全栈)- 公共安全方向
- leetcode:881. lifeboat
猜你喜欢

Penetration testing methodology

MySQL----函数

想进阿里必须啃透的12道MySQL面试题

超级哇塞的快排,你值得学会!

申请代码签名证书时如何选择合适的证书品牌?

Photoshop plug-in action related concepts actionlist actiondescriptor actionlist action execution load call delete PS plug-in development

市值蒸发超百亿美元,“全球IoT云平台第一股”赴港求生

There is a powerful and good-looking language bird editor, which is better than typora and developed by Alibaba

Two Bi development, more than 3000 reports? How to do it?

Dark horse programmer - software testing -10 stage 2-linux and database -44-57 why learn database, description of database classification relational database, description of Navicat operation data, de
随机推荐
CPU设计实战-第四章实践任务二用阻塞技术解决相关引发的冲突
Change multiple file names with one click
There is a powerful and good-looking language bird editor, which is better than typora and developed by Alibaba
开挖财上的证券账户可以吗?安全吗?
P1451 求细胞数量/1329:【例8.2】细胞
两个BI开发,3000多张报表?如何做的到?
[12 classic written questions of array and advanced pointer] these questions meet all your illusions about array and pointer, come on!
【leetcode周赛总结】LeetCode第 81 场双周赛(6.25)
Disjoint Set
CODING DevSecOps 助力金融企业跑出数字加速度
Type declaration of all DOM elements in TS
Install and configure Jenkins
Implement a blog system -- using template engine technology
机器学习框架简述
你童年的快乐,都是被它承包了
leetcode:881. 救生艇
Matrix chain multiplication dynamic programming example
NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读
[detailed explanation of Huawei machine test] character statistics and rearrangement
Strong connection component