当前位置:网站首页>超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:59:00 【智源社區】
最近,來自北大和微軟的研究人員基於自洽的新方法DiVeRSe,包含三個主要的創新點,進一步提昇了模型的推理能力。
論文鏈接:https://arxiv.org/abs/2206.02336
代碼鏈接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的啟發,即從語言模型中采樣不同的推理路徑,DiVeRSe在多樣性上更進一步,按照「條條大路通羅馬」的理念,使用多個prompt生成答案,能够生成更完整、互補的答案。
第二,在生成推理路徑時,語言模型中並不存在一種機制來糾正先前步驟中的錯誤,可能會導致最終預測結果的混亂。DiVeRSe借鑒verifier的思想,對每個推理路徑的正確性進行驗證來引導投票機制。也就是說,並非所有的推理機制都是相等重要的或都是好的。
第三,由於答案是基於多個步驟的推理而產生的,當一個路徑生成一個正確的答案時,可以認為所有的步驟都對最終的正確性做出了貢獻。然而,當生成一個錯誤的答案時,這並不意味著所有的步驟都是錯誤的或對錯誤有貢獻。
边栏推荐
- Drive brushless DC motor based on Ti drv10970
- 做研究无人咨询、与学生不交心,UNC助理教授两年教职挣扎史
- MySQL之CRUD
- How can I quickly check whether there is an error after FreeSurfer runs Recon all—— Core command tail redirection
- 我想咨询一下,mysql一个事务对于多张表的更新,怎么保证数据一致性的?
- Using tensorboard to visualize the training process in pytoch
- How to solve the problem of garbled code when installing dependency through NPM or yarn
- 漫画:优秀的程序员具备哪些属性?
- Implement a blog system -- using template engine technology
- useMemo,memo,useRef等相关hooks详解
猜你喜欢
面试突击62:group by 有哪些注意事项?
社区团购撤城“后遗症”
There is a powerful and good-looking language bird editor, which is better than typora and developed by Alibaba
How to paste the contents copied by the computer into mobaxterm? How to copy and paste
亿咖通科技通过ISO27001与ISO21434安全管理体系认证
你童年的快乐,都是被它承包了
Live broadcast preview | how to implement Devops with automatic tools (welfare at the end of the article)
P6183 [USACO10MAR] The Rock Game S
MongDB学习笔记
【NVMe2.0b 14-9】NVMe SR-IOV
随机推荐
Select sort and bubble sort
可转债打新在哪里操作开户是更安全可靠的呢
Crud de MySQL
Under the crisis of enterprise development, is digital transformation the future savior of enterprises
Super wow fast row, you are worth learning!
Creation and use of thymeleaf template
Machine learning notes - gray wolf optimization
CPU design related notes
leetcode:881. 救生艇
P1451 求细胞数量/1329:【例8.2】细胞
Talking about how dataset and dataloader call when loading data__ getitem__ () function
做研究无人咨询、与学生不交心,UNC助理教授两年教职挣扎史
【招聘岗位】基础设施软件开发人员
Visual task scheduling & drag and drop | scalph data integration based on Apache seatunnel
FR练习题目---简单题
【leetcode周赛总结】LeetCode第 81 场双周赛(6.25)
市值蒸发超百亿美元,“全球IoT云平台第一股”赴港求生
机器学习框架简述
想进阿里必须啃透的12道MySQL面试题
30岁汇源,要换新主人了