当前位置:网站首页>RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`问题解决
RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`问题解决
2022-07-07 02:18:00 【不撸先疯。】
一、问题描述
使用transformers包调用pytorch框架的Bert预训练模型时,使用正常的bert-base-cased在其他数据集上正常运行,但是运用Roberta的时候却一直报错:RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)`
忙活了好几天也没查出是什么错误,网上一直提醒batch_size是否太大导致,修改为16->8->4->2都没有用。
通过与其他数据集的对比,发现我在tokenizer中加入了新的special_token,导致可能报错了!
二、问题解决
在原始的tokenizer中加入special_tokens时,忘记将model的tokenizer的词表进行更新导致!
完整更新方式为:
from transformers import BertTokenizer, BertModel
tokenizer = BertTokenizer.from_pretrained('bert-base-cased')
# 添加特殊词
tokenizer.add_special_tokens({'additional_special_tokens':["<S>"]})
model = BertModel.from_pretrained("bert-base-cased")
# 在模型中更新词表的大小!
# 重要!
model.resize_token_embeddings(len(tokenizer))
三、问题解决
可以通过,开始训练!
边栏推荐
- [GNN] graphic gnn:a gender Introduction (including video)
- 中英文说明书丨ProSci LAG-3 重组蛋白
- 地质学类比较有名的外文期刊有哪些?
- How to use wechat cloud hosting or cloud functions for cloud development of unapp development applet
- Go straight to the 2022ecdc fluorite cloud Developer Conference: work with thousands of industries to accelerate intelligent upgrading
- 精准时空行程流调系统—基于UWB超高精度定位系统
- Symmetric binary tree [tree traversal]
- ViewModelProvider.of 过时方法解决
- CloudCompare-点对选取
- Knight defeats demon king (Backpack & DP)
猜你喜欢
Developers don't miss it! Oar hacker marathon phase III chain oar track registration opens
Can't you really do it when you are 35 years old?
直击2022ECDC萤石云开发者大会:携手千百行业加速智能升级
Programmers' daily | daily anecdotes
快速定量,Abbkine 蛋白质定量试剂盒BCA法来了!
地质学类比较有名的外文期刊有哪些?
请问如何查一篇外文文献的DOI号?
安装VMmare时候提示hyper-v / device defender 侧通道安全性
Jmeter 5.5版本发布说明
JESD204B时钟网络
随机推荐
Unity C# 函数笔记
Redis(二)—Redis通用命令
快速定量,Abbkine 蛋白质定量试剂盒BCA法来了!
C language interview to write a function to find the first public string in two strings
Which foreign language periodicals are famous in geology?
JMeter function assistant - random value, random string, fixed value random extraction
How to install swoole under window
港科大&MSRA新研究:关于图像到图像转换,Fine-tuning is all you need
Postgresql源码(59)分析事务ID分配、溢出判断方法
安装mongodb数据库
Redis (II) - redis General Command
CloudCompare-点对选取
中英文说明书丨ProSci LAG-3 重组蛋白
Niuke Xiaobai monthly race 52 E. sum logarithms in groups (two points & inclusion and exclusion)
How can I check the DOI number of a foreign document?
FPGA课程:JESD204B的应用场景(干货分享)
Abnova 膜蛋白脂蛋白体技术及类别展示
学术报告系列(六) - Autonomous Driving on the journey to full autonomy
What books can greatly improve programming ideas and abilities?
途家、木鸟、美团……民宿暑期战事将起