当前位置:网站首页>超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:59:00 【智源社區】
最近,來自北大和微軟的研究人員基於自洽的新方法DiVeRSe,包含三個主要的創新點,進一步提昇了模型的推理能力。

論文鏈接:https://arxiv.org/abs/2206.02336
代碼鏈接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的啟發,即從語言模型中采樣不同的推理路徑,DiVeRSe在多樣性上更進一步,按照「條條大路通羅馬」的理念,使用多個prompt生成答案,能够生成更完整、互補的答案。
第二,在生成推理路徑時,語言模型中並不存在一種機制來糾正先前步驟中的錯誤,可能會導致最終預測結果的混亂。DiVeRSe借鑒verifier的思想,對每個推理路徑的正確性進行驗證來引導投票機制。也就是說,並非所有的推理機制都是相等重要的或都是好的。
第三,由於答案是基於多個步驟的推理而產生的,當一個路徑生成一個正確的答案時,可以認為所有的步驟都對最終的正確性做出了貢獻。然而,當生成一個錯誤的答案時,這並不意味著所有的步驟都是錯誤的或對錯誤有貢獻。
边栏推荐
- FR练习题目---综合题
- 30岁汇源,要换新主人了
- Run faster with go: use golang to serve machine learning
- Crud of MySQL
- NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读
- useMemo,memo,useRef等相关hooks详解
- 我这边同时采集多个oracle表,采集一会以后,会报oracle的oga内存超出,大家有没有遇到的?
- CODING DevSecOps 助力金融企业跑出数字加速度
- P6183 [USACO10MAR] The Rock Game S
- Fr exercise topic --- comprehensive question
猜你喜欢
随机推荐
Live broadcast preview | how to implement Devops with automatic tools (welfare at the end of the article)
Dark horse programmer - software testing -10 stage 2-linux and database -44-57 why learn database, description of database classification relational database, description of Navicat operation data, de
Fr exercise topic - simple question
Mysql---- function
P6183 [USACO10MAR] The Rock Game S
Coding devsecops helps financial enterprises run out of digital acceleration
[detailed explanation of Huawei machine test] character statistics and rearrangement
Photoshop插件-动作相关概念-ActionList-ActionDescriptor-ActionList-动作执行加载调用删除-PS插件开发
STM32+BH1750光敏传感器获取光照强度
ICML 2022 | 探索语言模型的最佳架构和训练方法
有一个强大又好看的,赛过Typora,阿里开发的语雀编辑器
计算中间件 Apache Linkis参数解读
两个BI开发,3000多张报表?如何做的到?
【招聘岗位】软件工程师(全栈)- 公共安全方向
[recruitment position] infrastructure software developer
Topology visual drawing engine
【leetcode周赛总结】LeetCode第 81 场双周赛(6.25)
想进阿里必须啃透的12道MySQL面试题
[JVM] operation instruction
Easyocr character recognition









