当前位置:网站首页>超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:48:00 【智源社区】
最近,来自北大和微软的研究人员基于自洽的新方法DiVeRSe,包含三个主要的创新点,进一步提升了模型的推理能力。

论文链接:https://arxiv.org/abs/2206.02336
代码链接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的启发,即从语言模型中采样不同的推理路径,DiVeRSe在多样性上更进一步,按照「条条大路通罗马」的理念,使用多个prompt生成答案,能够生成更完整、互补的答案。
第二,在生成推理路径时,语言模型中并不存在一种机制来纠正先前步骤中的错误,可能会导致最终预测结果的混乱。DiVeRSe借鉴verifier的思想,对每个推理路径的正确性进行验证来引导投票机制。也就是说,并非所有的推理机制都是相等重要的或都是好的。
第三,由于答案是基于多个步骤的推理而产生的,当一个路径生成一个正确的答案时,可以认为所有的步骤都对最终的正确性做出了贡献。然而,当生成一个错误的答案时,这并不意味着所有的步骤都是错误的或对错误有贡献。
边栏推荐
- Isn't it right to put money into the external market? How can we ensure safety?
- Strong connection component
- Shanghai under layoffs
- leetcode:881. 救生艇
- MySQL之CRUD
- Visual task scheduling & drag and drop | scalph data integration based on Apache seatunnel
- Install and configure Jenkins
- be careful! Software supply chain security challenges continue to escalate
- Under the crisis of enterprise development, is digital transformation the future savior of enterprises
- 机器学习框架简述
猜你喜欢

计算中间件 Apache Linkis参数解读

CPU design related notes

Penetration testing methodology

Live broadcast preview | how to implement Devops with automatic tools (welfare at the end of the article)

FR练习题目---综合题

市值蒸发超百亿美元,“全球IoT云平台第一股”赴港求生

729. My schedule I: "simulation" & "line segment tree (dynamic open point) &" block + bit operation (bucket Division) "

百亿按摩仪蓝海,难出巨头

There is a powerful and good-looking language bird editor, which is better than typora and developed by Alibaba

P1451 求细胞数量/1329:【例8.2】细胞
随机推荐
Handwriting promise and async await
通过npm 或者 yarn安装依赖时 报错 出现乱码解决方式
Penetration testing methodology
STM32+BH1750光敏传感器获取光照强度
PHP - fatal error: allowed memory size of 314572800 bytes exhausted
12 MySQL interview questions that you must chew through to enter Alibaba
C language -- structure and function
webRTC SDP mslabel lable
P1451 求细胞数量/1329:【例8.2】细胞
Coding devsecops helps financial enterprises run out of digital acceleration
CPU设计实战-第四章实践任务二用阻塞技术解决相关引发的冲突
黑马程序员-软件测试-10阶段2-linux和数据库-44-57为什么学习数据库,数据库分类关系型数据库的说明Navicat操作数据的说明,Navicat操作数据库连接说明,Navicat的基本使用,
Structure - C language
Run faster with go: use golang to serve machine learning
申请代码签名证书时如何选择合适的证书品牌?
webRTC SDP mslabel lable
MySQL之CRUD
leetcode:881. lifeboat
想问下大家伙,有无是从腾讯云MYSQL同步到其他地方的呀?腾讯云MySQL存到COS上的binlog
MySQL之CRUD