当前位置:网站首页>spark报错OutOfMemory「建议收藏」
spark报错OutOfMemory「建议收藏」
2022-07-31 16:53:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
最近在使用spark进行分析的时候 几千万的数据量感觉不多 但是跑起来非常慢
内存溢出OutOfMemory
1.然后在有使用map的地方 在map之前进行分区repartition
2.join会有shuffle产生 shuffle也会产生数据溢出
3.map也可以换成 mapPartitions 并且适当调整分区数 200 400
其他的还有很多 我用的就这些 然后任务可以跑出来。
还有什么错误 比如 reset by peer还有什么255的错误
报错信息没有记录
然后使用配置文件去调整
config.set("spark.network.timeout","100000")
config.set("spark.executor.heartbeatInterval","100s")
config.set("spark.executor.memory", "50g")
config.set("spark.shuffle.blockTransferService", "nio")没用
主要是代码问题。。。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/127866.html原文链接:https://javaforall.cn
边栏推荐
猜你喜欢
![[Network Communication 3] Advantech Gateway Modbus Service Settings](/img/ec/e9e1d9a374183ecaa8a8c9437ec82c.png)
[Network Communication 3] Advantech Gateway Modbus Service Settings

TestCafe总结

adb shell error error: device unauthorized

2022年整理LeetCode最新刷题攻略分享(附中文详细题解)

九齐ny3p系列语音芯片替代国产方案KT148A性价比更高420秒长度

Golang——从入门到放弃

Kotlin coroutines: continuation, continuation interceptor, scheduler

关于柱状图的经典画法总结

ECCV 2022 华科&ETH提出首个用于伪装实例分割的一阶段Transformer的框架OSFormer!代码已开源!...

Kotlin协程:续体、续体拦截器、调度器
随机推荐
上传图片-微信小程序(那些年的坑记录2022.4)
联邦学习:联邦场景下的多源知识图谱嵌入
关于柱状图的经典画法总结
2022年Android 面经总结(附含面试题 | 源码 | 面试资料)
动态规划之线性dp(下)
九齐ny3p系列语音芯片替代国产方案KT148A性价比更高420秒长度
牛客 HJ19 简单错误记录
Intelligent bin (9) - vibration sensor (raspberries pie pico implementation)
【luogu P8326】Fliper (Graph Theory) (Construction) (Eulerian Circuit)
2022年必读的12本机器学习书籍推荐
TypeError: unhashable type: ‘list‘
GP 6总体架构学习笔记
Golang——从入门到放弃
【luogu P8326】Fliper(图论)(构造)(欧拉回路)
【码蹄集新手村600题】不通过字符数组来合并俩个数字
JS基础小练习
SringMVC中个常见的几个问题
After Effects 教程,如何在 After Effects 中调整过度曝光的快照?
Kotlin协程:续体、续体拦截器、调度器
Handling write conflicts under multi-master replication (3) - Convergence to a consistent state and custom conflict resolution logic