当前位置:网站首页>Au - delà du PARM! La maîtrise de l'Université de Pékin propose diverse pour actualiser complètement le classement du raisonnement du NLP
Au - delà du PARM! La maîtrise de l'Université de Pékin propose diverse pour actualiser complètement le classement du raisonnement du NLP
2022-07-05 14:59:00 【Communauté des sages】
Récemment,Une nouvelle approche auto - cohérente pour les chercheurs de l'Université de Pékin et de MicrosoftDiVeRSe,Contient trois innovations majeures,Améliorer encore la capacité de raisonnement du modèle.
Liens vers les articles:https://arxiv.org/abs/2206.02336
Liens de code:https://github.com/microsoft/DiVeRSe
Premièrement,Recevoir une approche auto - cohérente「Les idées sont différentes.,La réponse est la même.」Inspiré par,C'est - à - dire échantillonner différents chemins d'inférence à partir de modèles linguistiques,DiVeRSeAller plus loin dans la diversité,Selon「Toutes les routes mènent à Rome」La philosophie,Utiliser plusieurspromptGénérer des réponses,Peut produire plus complet、Réponses complémentaires.
Deuxièmement,Lors de la génération du chemin d'inférence,Il n'existe pas de mécanisme dans le Modèle linguistique pour corriger les erreurs des étapes précédentes.,Risque de confusion quant au résultat final prévu.DiVeRSeApprendre deverifierDes idées,Vérifier l'exactitude de chaque chemin de raisonnement pour guider le mécanisme de vote.C'est - à - dire,Tous les mécanismes de raisonnement ne sont pas aussi importants ou bons.
Troisièmement,Parce que les réponses sont basées sur un raisonnement en plusieurs étapes,Quand un chemin génère la bonne réponse,Toutes les étapes peuvent être considérées comme contribuant à l'exactitude finale.Et pourtant, Quand une mauvaise réponse est générée , Cela ne signifie pas que toutes les étapes sont mauvaises ou contribuent à l'erreur .
边栏推荐
- 面试突击62:group by 有哪些注意事项?
- 实现一个博客系统----使用模板引擎技术
- Photoshop插件-动作相关概念-ActionList-ActionDescriptor-ActionList-动作执行加载调用删除-PS插件开发
- TS所有dom元素的类型声明
- 社区团购撤城“后遗症”
- Structure - C language
- Two policemen were shot dead in a "safety accident" in Philadelphia, USA
- Jmeter性能测试:ServerAgent资源监控
- 用 Go 跑的更快:使用 Golang 为机器学习服务
- 做研究无人咨询、与学生不交心,UNC助理教授两年教职挣扎史
猜你喜欢
随机推荐
【jvm】运算指令
Behind the ultra clear image quality of NBA Live Broadcast: an in-depth interpretation of Alibaba cloud video cloud "narrowband HD 2.0" technology
我想咨询一下,mysql一个事务对于多张表的更新,怎么保证数据一致性的?
Is the securities account given by the head teacher of qiniu school safe? Can I open an account?
30岁汇源,要换新主人了
裁员下的上海
MySQL之CRUD
P1451 求细胞数量/1329:【例8.2】细胞
How to paste the contents copied by the computer into mobaxterm? How to copy and paste
Implement a blog system -- using template engine technology
P6183 [USACO10MAR] The Rock Game S
一键更改多个文件名字
Can I pass the PMP Exam in 20 days?
CPU design related notes
Photoshop plug-in action related concepts actionlist actiondescriptor actionlist action execution load call delete PS plug-in development
Pointer operation - C language
【招聘岗位】软件工程师(全栈)- 公共安全方向
Install and configure Jenkins
手写promise与async await
I want to inquire about how to ensure data consistency when a MySQL transaction updates multiple tables?