当前位置：网站首页>超越PaLM！北大碩士提出DiVeRSe，全面刷新NLP推理排行榜

超越PaLM！北大碩士提出DiVeRSe，全面刷新NLP推理排行榜

2022-07-05 14:59:00 【智源社區】

最近，來自北大和微軟的研究人員基於自洽的新方法DiVeRSe，包含三個主要的創新點，進一步提昇了模型的推理能力。

第一，受到自洽方式「想法不同，答案相同」的啟發，即從語言模型中采樣不同的推理路徑，DiVeRSe在多樣性上更進一步，按照「條條大路通羅馬」的理念，使用多個prompt生成答案，能够生成更完整、互補的答案。

第二，在生成推理路徑時，語言模型中並不存在一種機制來糾正先前步驟中的錯誤，可能會導致最終預測結果的混亂。DiVeRSe借鑒verifier的思想，對每個推理路徑的正確性進行驗證來引導投票機制。也就是說，並非所有的推理機制都是相等重要的或都是好的。

第三，由於答案是基於多個步驟的推理而產生的，當一個路徑生成一個正確的答案時，可以認為所有的步驟都對最終的正確性做出了貢獻。然而，當生成一個錯誤的答案時，這並不意味著所有的步驟都是錯誤的或對錯誤有貢獻。

版权声明
本文为[智源社區]所创，转载请带上原文链接，感谢
https://yzsam.com/2022/186/202207051448474470.html