当前位置:网站首页>超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:59:00 【智源社區】
最近,來自北大和微軟的研究人員基於自洽的新方法DiVeRSe,包含三個主要的創新點,進一步提昇了模型的推理能力。
論文鏈接:https://arxiv.org/abs/2206.02336
代碼鏈接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的啟發,即從語言模型中采樣不同的推理路徑,DiVeRSe在多樣性上更進一步,按照「條條大路通羅馬」的理念,使用多個prompt生成答案,能够生成更完整、互補的答案。
第二,在生成推理路徑時,語言模型中並不存在一種機制來糾正先前步驟中的錯誤,可能會導致最終預測結果的混亂。DiVeRSe借鑒verifier的思想,對每個推理路徑的正確性進行驗證來引導投票機制。也就是說,並非所有的推理機制都是相等重要的或都是好的。
第三,由於答案是基於多個步驟的推理而產生的,當一個路徑生成一個正確的答案時,可以認為所有的步驟都對最終的正確性做出了貢獻。然而,當生成一個錯誤的答案時,這並不意味著所有的步驟都是錯誤的或對錯誤有貢獻。
边栏推荐
- 选择排序和冒泡排序
- qt creater断点调试程序详解
- Detailed explanation of usememo, memo, useref and other relevant hooks
- Easyocr character recognition
- 启牛证券账户怎么开通,开户安全吗?
- P1451 求细胞数量/1329:【例8.2】细胞
- 手写promise与async await
- CPU设计实战-第四章实践任务三用前递技术解决相关引发的冲突
- Mysql---- function
- Coding devsecops helps financial enterprises run out of digital acceleration
猜你喜欢
随机推荐
Topology visual drawing engine
Cartoon: programmers don't repair computers!
Change multiple file names with one click
Anaconda uses China University of science and technology source
危机重重下的企业发展,数字化转型到底是不是企业未来救星
Live broadcast preview | how to implement Devops with automatic tools (welfare at the end of the article)
PostgreSQL 13 installation
微帧科技荣获全球云计算大会“云鼎奖”!
FR练习题目---综合题
I collect multiple Oracle tables at the same time. After collecting for a while, I will report that Oracle's OGA memory is exceeded. Have you encountered it?
webRTC SDP mslabel lable
一键更改多个文件名字
计算中间件 Apache Linkis参数解读
12 MySQL interview questions that you must chew through to enter Alibaba
美团优选管理层变动:老将刘薇调岗,前阿里高管加盟
Creation and use of thymeleaf template
Dark horse programmer - software testing -10 stage 2-linux and database -44-57 why learn database, description of database classification relational database, description of Navicat operation data, de
[recruitment position] infrastructure software developer
Brief introduction of machine learning framework
【NVMe2.0b 14-9】NVMe SR-IOV