当前位置:网站首页>谷歌新论文-Minerva:用语言模型解决定量推理问题
谷歌新论文-Minerva:用语言模型解决定量推理问题
2022-07-01 10:47:00 【智源社区】
定量推理是语言模型仍然远远低于人类水平的一个领域。解决数学和科学问题需要综合技能,包括用自然语言和数学符号正确解析问题、回忆相关公式和常数,以及生成涉及数值计算和符号操作的逐步解决方案。由于这些挑战,人们通常认为,使用机器学习解决定量推理问题将需要模型架构和训练技术方面的重大进步,允许模型访问外部工具,如 Python 解释器,或者可能需要更深刻的范式转变。
在“使用语言模型解决定量推理问题”(即将在 arXiv 上发布)中,我们介绍了 Minerva,一种能够使用逐步推理解决数学和科学问题的语言模型。我们表明,通过专注于收集与定量推理问题相关的训练数据、大规模训练模型以及采用一流的推理技术,我们在各种困难的定量推理任务上取得了显着的性能提升。 Minerva 通过生成包括数值计算和符号操作的解决方案来解决此类问题,而无需依赖计算器等外部工具。该模型结合使用自然语言和数学符号来解析和回答数学问题。 Minerva 结合了多种技术,包括小样本提示、思维链或暂存器提示以及多数投票,以在 STEM 推理任务上实现最先进的性能。

边栏推荐
- Matplotlib数据可视化基础
- Matplotlib data visualization Foundation
- Who's still buying three squirrels
- PHP realizes lottery function
- IDEA运行报错Command line is too long. Shorten command line for...
- Button button clear border
- [encounter Django] - (II) database configuration
- 数字藏品新一轮热度开启
- How to solve the problem of SQL?
- 基金国际化的发展概况
猜你喜欢

Error: missing revert data in call exception

Addition, deletion, modification and query of database

.NET 5.0+ 无需依赖第三方 原生实现定时任务

零基础入门测试该学什么?最全整理,照着学就对了

Kotlin 协程调度切换线程是时候解开真相了

《百年巨匠》数字藏品中奖名单公布
![[matytype] insert MathType inter line and intra line formulas in CSDN blog](/img/ff/871a3f06f898ed107a2a974d2c7bc4.png)
[matytype] insert MathType inter line and intra line formulas in CSDN blog

What a high commission! The new programmer's partner plan is coming. Everyone can participate!

基于Matlab的开环Buck降压斩波电路Simulink仿真电路模型搭建

12 product management platforms that everyone is using
随机推荐
Wireshark TS | 快速重传和乱序之混淆
I'd like to know where I can open an account in Guangzhou? Is it safe to open an account online now?
华为HMS Core携手超图为三维GIS注入新动能
[matytype] insert MathType inter line and intra line formulas in CSDN blog
投稿开奖丨轻量应用服务器征文活动(5月)奖励公布
关于#SQL#的问题,如何解决?
Sqlachemy common operations
数字藏品新一轮热度开启
12款大家都在用的產品管理平臺
SQL Server列一相同的情况下,如何取列二的最大值,并重新生成表
[.NET6]使用ML.NET+ONNX预训练模型整活B站经典《华强买瓜》
缺少比较器,运放来救场!(运放当做比较器电路记录)
How do clients request databases?
12 product management platforms that everyone is using
Daily mathematics serial 55: February 24
leetcode:111. Minimum depth of binary tree
CRC check
Does anyone know why? The table structure is the source table MySQL CDC that has just been directly copied
LeetCode.515. 在每个树行中找最大值___逐一BFS+DFS+按层BFS
【邂逅Django】——(二)数据库配置