当前位置:网站首页>超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:59:00 【智源社區】
最近,來自北大和微軟的研究人員基於自洽的新方法DiVeRSe,包含三個主要的創新點,進一步提昇了模型的推理能力。

論文鏈接:https://arxiv.org/abs/2206.02336
代碼鏈接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的啟發,即從語言模型中采樣不同的推理路徑,DiVeRSe在多樣性上更進一步,按照「條條大路通羅馬」的理念,使用多個prompt生成答案,能够生成更完整、互補的答案。
第二,在生成推理路徑時,語言模型中並不存在一種機制來糾正先前步驟中的錯誤,可能會導致最終預測結果的混亂。DiVeRSe借鑒verifier的思想,對每個推理路徑的正確性進行驗證來引導投票機制。也就是說,並非所有的推理機制都是相等重要的或都是好的。
第三,由於答案是基於多個步驟的推理而產生的,當一個路徑生成一個正確的答案時,可以認為所有的步驟都對最終的正確性做出了貢獻。然而,當生成一個錯誤的答案時,這並不意味著所有的步驟都是錯誤的或對錯誤有貢獻。
边栏推荐
猜你喜欢

How can I quickly check whether there is an error after FreeSurfer runs Recon all—— Core command tail redirection

Topology visual drawing engine

qt creater断点调试程序详解

一键更改多个文件名字

How to paste the contents copied by the computer into mobaxterm? How to copy and paste

做研究无人咨询、与学生不交心,UNC助理教授两年教职挣扎史

12 MySQL interview questions that you must chew through to enter Alibaba

Pointer operation - C language

30岁汇源,要换新主人了

NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读
随机推荐
启牛证券账户怎么开通,开户安全吗?
CPU design practice - Chapter 4 practical task 2 using blocking technology to solve conflicts caused by related problems
浅谈Dataset和Dataloader在加载数据时如何调用到__getitem__()函数
Anaconda uses China University of science and technology source
两个BI开发,3000多张报表?如何做的到?
Type declaration of all DOM elements in TS
Crud de MySQL
Microframe technology won the "cloud tripod Award" at the global Cloud Computing Conference!
ICML 2022 | 探索语言模型的最佳架构和训练方法
微帧科技荣获全球云计算大会“云鼎奖”!
TS所有dom元素的类型声明
实现一个博客系统----使用模板引擎技术
Visual task scheduling & drag and drop | scalph data integration based on Apache seatunnel
JS bright blind your eyes date selector
【C 题集】of Ⅷ
Photoshop插件-动作相关概念-非加载执行动作文件中动作-PS插件开发
【华为机试真题详解】字符统计及重排
729. 我的日程安排表 I :「模拟」&「线段树(动态开点)」&「分块 + 位运算(分桶)」
B站做短视频,学抖音死,学YouTube生?
webRTC SDP mslabel lable