当前位置:网站首页>spark报错OutOfMemory「建议收藏」
spark报错OutOfMemory「建议收藏」
2022-07-31 16:53:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
最近在使用spark进行分析的时候 几千万的数据量感觉不多 但是跑起来非常慢
内存溢出OutOfMemory
1.然后在有使用map的地方 在map之前进行分区repartition
2.join会有shuffle产生 shuffle也会产生数据溢出
3.map也可以换成 mapPartitions 并且适当调整分区数 200 400
其他的还有很多 我用的就这些 然后任务可以跑出来。
还有什么错误 比如 reset by peer还有什么255的错误
报错信息没有记录
然后使用配置文件去调整
config.set("spark.network.timeout","100000")
config.set("spark.executor.heartbeatInterval","100s")
config.set("spark.executor.memory", "50g")
config.set("spark.shuffle.blockTransferService", "nio")
没用
主要是代码问题。。。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/127866.html原文链接:https://javaforall.cn
边栏推荐
猜你喜欢
上传图片-微信小程序(那些年的坑记录2022.4)
ECCV 2022 华科&ETH提出首个用于伪装实例分割的一阶段Transformer的框架OSFormer!代码已开源!...
[Network Communication 3] Advantech Gateway Modbus Service Settings
Golang go-redis cluster模式下不断创建新连接,效率下降问题解决
GP 6 overall architecture study notes
2022年必读的12本机器学习书籍推荐
LevelSequence源码分析
i.MX6ULL driver development | 33 - NXP original network device driver reading (LAN8720 PHY)
研发过程中的文档管理与工具
A common method and the use of selenium
随机推荐
牛客 HJ19 简单错误记录
6. 使用 Postman 工具高效管理和测试 SAP ABAP OData 服务
go记录之——slice
Kotlin coroutines: continuation, continuation interceptor, scheduler
牛客网刷题(二)
go基础部分学习笔记记录
使用互相关进行音频对齐
Flutter gets the height of the status bar statusbar
Kotlin协程:续体、续体拦截器、调度器
牛客网刷题(四)
How C programs run 01 - the composition of ordinary executable files
Huawei mobile phone one-click to open "maintenance mode" to hide all data and make mobile phone privacy more secure
TestCafe总结
The arm button controls the flashing of the led light (embedded button experiment report)
动态规划之线性dp(上)
【Yugong Series】July 2022 Go Teaching Course 020-Array of Go Containers
2022年整理LeetCode最新刷题攻略分享(附中文详细题解)
华为手机一键开启“维修模式”隐藏所有数据,让手机隐私更加安全
牛客 HJ20 密码验证合格程序
牛客 HJ17 坐标移动