当前位置:网站首页>超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大碩士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:59:00 【智源社區】
最近,來自北大和微軟的研究人員基於自洽的新方法DiVeRSe,包含三個主要的創新點,進一步提昇了模型的推理能力。

論文鏈接:https://arxiv.org/abs/2206.02336
代碼鏈接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的啟發,即從語言模型中采樣不同的推理路徑,DiVeRSe在多樣性上更進一步,按照「條條大路通羅馬」的理念,使用多個prompt生成答案,能够生成更完整、互補的答案。
第二,在生成推理路徑時,語言模型中並不存在一種機制來糾正先前步驟中的錯誤,可能會導致最終預測結果的混亂。DiVeRSe借鑒verifier的思想,對每個推理路徑的正確性進行驗證來引導投票機制。也就是說,並非所有的推理機制都是相等重要的或都是好的。
第三,由於答案是基於多個步驟的推理而產生的,當一個路徑生成一個正確的答案時,可以認為所有的步驟都對最終的正確性做出了貢獻。然而,當生成一個錯誤的答案時,這並不意味著所有的步驟都是錯誤的或對錯誤有貢獻。
边栏推荐
- 【NVMe2.0b 14-9】NVMe SR-IOV
- 市值蒸发超百亿美元,“全球IoT云平台第一股”赴港求生
- CPU design related notes
- CPU设计相关笔记
- Select sort and bubble sort
- CPU design practice - Chapter 4 practice task 3 use pre delivery technology to solve conflicts caused by related issues
- CODING DevSecOps 助力金融企业跑出数字加速度
- Creation and use of thymeleaf template
- Leetcode: Shortest Word Distance II
- Microframe technology won the "cloud tripod Award" at the global Cloud Computing Conference!
猜你喜欢

12 MySQL interview questions that you must chew through to enter Alibaba

Microframe technology won the "cloud tripod Award" at the global Cloud Computing Conference!

做研究无人咨询、与学生不交心,UNC助理教授两年教职挣扎史

【NVMe2.0b 14-9】NVMe SR-IOV

Fr exercise topic - simple question
![[JVM] operation instruction](/img/f5/85580495474ef58eafbb421338e93f.png)
[JVM] operation instruction

Run faster with go: use golang to serve machine learning

浅谈Dataset和Dataloader在加载数据时如何调用到__getitem__()函数

当代人的水焦虑:好水究竟在哪里?

Photoshop插件-动作相关概念-ActionList-ActionDescriptor-ActionList-动作执行加载调用删除-PS插件开发
随机推荐
Thymeleaf uses background custom tool classes to process text
CPU设计实战-第四章实践任务二用阻塞技术解决相关引发的冲突
Implement a blog system -- using template engine technology
Selection and use of bceloss, crossentropyloss, sigmoid, etc. in pytorch classification
P1451 求细胞数量/1329:【例8.2】细胞
Behind the ultra clear image quality of NBA Live Broadcast: an in-depth interpretation of Alibaba cloud video cloud "narrowband HD 2.0" technology
爱可可AI前沿推介(7.5)
Type declaration of all DOM elements in TS
Photoshop plug-in - action related concepts - actions in non loaded execution action files - PS plug-in development
CODING DevSecOps 助力金融企业跑出数字加速度
Topology visual drawing engine
长列表优化虚拟滚动
STM32+BH1750光敏传感器获取光照强度
Drive brushless DC motor based on Ti drv10970
Isn't it right to put money into the external market? How can we ensure safety?
[detailed explanation of Huawei machine test] character statistics and rearrangement
【招聘岗位】软件工程师(全栈)- 公共安全方向
Handwriting promise and async await
百亿按摩仪蓝海,难出巨头
Shanghai under layoffs