当前位置:网站首页>超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
超越PaLM!北大硕士提出DiVeRSe,全面刷新NLP推理排行榜
2022-07-05 14:48:00 【智源社区】
最近,来自北大和微软的研究人员基于自洽的新方法DiVeRSe,包含三个主要的创新点,进一步提升了模型的推理能力。
论文链接:https://arxiv.org/abs/2206.02336
代码链接:https://github.com/microsoft/DiVeRSe
第一,受到自洽方式「想法不同,答案相同」的启发,即从语言模型中采样不同的推理路径,DiVeRSe在多样性上更进一步,按照「条条大路通罗马」的理念,使用多个prompt生成答案,能够生成更完整、互补的答案。
第二,在生成推理路径时,语言模型中并不存在一种机制来纠正先前步骤中的错误,可能会导致最终预测结果的混乱。DiVeRSe借鉴verifier的思想,对每个推理路径的正确性进行验证来引导投票机制。也就是说,并非所有的推理机制都是相等重要的或都是好的。
第三,由于答案是基于多个步骤的推理而产生的,当一个路径生成一个正确的答案时,可以认为所有的步骤都对最终的正确性做出了贡献。然而,当生成一个错误的答案时,这并不意味着所有的步骤都是错误的或对错误有贡献。
边栏推荐
- Longest common subsequence dynamic programming
- 机器学习框架简述
- 我想咨询一下,mysql一个事务对于多张表的更新,怎么保证数据一致性的?
- [12 classic written questions of array and advanced pointer] these questions meet all your illusions about array and pointer, come on!
- STM32+BH1750光敏传感器获取光照强度
- js亮瞎你眼的日期选择器
- Total amount analysis accounting method and potential method - allocation analysis
- Postgresql 13 安装
- Change multiple file names with one click
- anaconda使用中科大源
猜你喜欢
危机重重下的企业发展,数字化转型到底是不是企业未来救星
面试突击62:group by 有哪些注意事项?
你童年的快乐,都是被它承包了
P1451 求细胞数量/1329:【例8.2】细胞
NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读
Topology可视化绘图引擎
MongDB学习笔记
There is a powerful and good-looking language bird editor, which is better than typora and developed by Alibaba
Penetration testing methodology
[JVM] operation instruction
随机推荐
开挖财上的证券账户可以吗?安全吗?
729. 我的日程安排表 I :「模拟」&「线段树(动态开点)」&「分块 + 位运算(分桶)」
Handwriting promise and async await
Jmeter性能测试:ServerAgent资源监控
anaconda使用中科大源
qt creater断点调试程序详解
实现一个博客系统----使用模板引擎技术
长列表优化虚拟滚动
【NVMe2.0b 14-9】NVMe SR-IOV
Dark horse programmer - software testing -10 stage 2-linux and database -44-57 why learn database, description of database classification relational database, description of Navicat operation data, de
[recruitment position] infrastructure software developer
Under the crisis of enterprise development, is digital transformation the future savior of enterprises
Drive brushless DC motor based on Ti drv10970
Visual task scheduling & drag and drop | scalph data integration based on Apache seatunnel
R 熵权法计算权重及综合得分
我想咨询一下,mysql一个事务对于多张表的更新,怎么保证数据一致性的?
Install and configure Jenkins
There is a powerful and good-looking language bird editor, which is better than typora and developed by Alibaba
【招聘岗位】基础设施软件开发人员
I collect multiple Oracle tables at the same time. After collecting for a while, I will report that Oracle's OGA memory is exceeded. Have you encountered it?