当前位置:网站首页>超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:59:00 【智源社區】
最近,來自北大和微軟的研究人員基於自洽的新方法DiVeRSe,包含三個主要的創新點,進一步提昇了模型的推理能力。

論文鏈接:https://arxiv.org/abs/2206.02336
代碼鏈接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的啟發,即從語言模型中采樣不同的推理路徑,DiVeRSe在多樣性上更進一步,按照「條條大路通羅馬」的理念,使用多個prompt生成答案,能够生成更完整、互補的答案。
第二,在生成推理路徑時,語言模型中並不存在一種機制來糾正先前步驟中的錯誤,可能會導致最終預測結果的混亂。DiVeRSe借鑒verifier的思想,對每個推理路徑的正確性進行驗證來引導投票機制。也就是說,並非所有的推理機制都是相等重要的或都是好的。
第三,由於答案是基於多個步驟的推理而產生的,當一個路徑生成一個正確的答案時,可以認為所有的步驟都對最終的正確性做出了貢獻。然而,當生成一個錯誤的答案時,這並不意味著所有的步驟都是錯誤的或對錯誤有貢獻。
边栏推荐
- 【华为机试真题详解】欢乐的周末
- Anaconda uses China University of science and technology source
- Behind the ultra clear image quality of NBA Live Broadcast: an in-depth interpretation of Alibaba cloud video cloud "narrowband HD 2.0" technology
- Photoshop plug-in action related concepts actionlist actiondescriptor actionlist action execution load call delete PS plug-in development
- 729. 我的日程安排表 I :「模拟」&「线段树(动态开点)」&「分块 + 位运算(分桶)」
- 我想咨询一下,mysql一个事务对于多张表的更新,怎么保证数据一致性的?
- Mongdb learning notes
- 市值蒸发超百亿美元,“全球IoT云平台第一股”赴港求生
- 想问下大家伙,有无是从腾讯云MYSQL同步到其他地方的呀?腾讯云MySQL存到COS上的binlog
- 想进阿里必须啃透的12道MySQL面试题
猜你喜欢

一键更改多个文件名字

Install and configure Jenkins

如何将电脑复制的内容粘贴进MobaXterm?如何复制粘贴
![P6183 [USACO10MAR] The Rock Game S](/img/f4/d8c8763c27385d759d117b515fbf0f.png)
P6183 [USACO10MAR] The Rock Game S

Implement a blog system -- using template engine technology

CODING DevSecOps 助力金融企业跑出数字加速度

用 Go 跑的更快:使用 Golang 为机器学习服务

12 MySQL interview questions that you must chew through to enter Alibaba

Select sort and bubble sort

做研究无人咨询、与学生不交心,UNC助理教授两年教职挣扎史
随机推荐
Leetcode: Shortest Word Distance II
js亮瞎你眼的日期选择器
Is it OK to open the securities account on the excavation finance? Is it safe?
Easyocr character recognition
Isn't it right to put money into the external market? How can we ensure safety?
TS所有dom元素的类型声明
NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读
Under the crisis of enterprise development, is digital transformation the future savior of enterprises
Coding devsecops helps financial enterprises run out of digital acceleration
anaconda使用中科大源
qt creater断点调试程序详解
可视化任务编排&拖拉拽 | Scaleph 基于 Apache SeaTunnel的数据集成
Reconnaissance des caractères easycr
[recruitment position] infrastructure software developer
How can I quickly check whether there is an error after FreeSurfer runs Recon all—— Core command tail redirection
【NVMe2.0b 14-9】NVMe SR-IOV
Photoshop plug-in - action related concepts - actions in non loaded execution action files - PS plug-in development
Using tensorboard to visualize the training process in pytoch
长列表优化虚拟滚动
webRTC SDP mslabel lable