当前位置:网站首页>spark报错OutOfMemory「建议收藏」
spark报错OutOfMemory「建议收藏」
2022-07-31 16:53:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
最近在使用spark进行分析的时候 几千万的数据量感觉不多 但是跑起来非常慢
内存溢出OutOfMemory
1.然后在有使用map的地方 在map之前进行分区repartition
2.join会有shuffle产生 shuffle也会产生数据溢出
3.map也可以换成 mapPartitions 并且适当调整分区数 200 400
其他的还有很多 我用的就这些 然后任务可以跑出来。
还有什么错误 比如 reset by peer还有什么255的错误
报错信息没有记录
然后使用配置文件去调整
config.set("spark.network.timeout","100000")
config.set("spark.executor.heartbeatInterval","100s")
config.set("spark.executor.memory", "50g")
config.set("spark.shuffle.blockTransferService", "nio")没用
主要是代码问题。。。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/127866.html原文链接:https://javaforall.cn
边栏推荐
- 华为顶级工程师历时9年总结的“趣谈网络协议”PDF文档,太强了
- Anaconda如何顺利安装CV2
- Introduction of Jerry voice chip ic toy chip ic_AD14NAD15N full series development
- Premiere Pro 2022 for (pr 2022)v22.5.0
- 深度学习机器学习理论及应用实战-必备知识点整理分享
- 【Yugong Series】July 2022 Go Teaching Course 021-Slicing Operation of Go Containers
- 动态规划之线性dp(下)
- 【愚公系列】2022年07月 Go教学课程 021-Go容器之切片操作
- [TypeScript]OOP
- [TypeScript] OOP
猜你喜欢
随机推荐
【pytorch】1.7 pytorch与numpy,tensor与array的转换
【愚公系列】2022年07月 Go教学课程 022-Go容器之字典
Smart Trash Can (8) - Infrared Tube Sensor (Raspberry Pi pico)
UserAgent 解析
Verilog实现占空比为5/18的9分频
TestCafe总结
二分查找的细节坑
浅谈网络安全之算法安全
flutter设置statusbar状态栏的背景颜色和 APP(AppBar)内部颜色一致方法。
js的toString方法
How Redis handles concurrent access
Three aspects of Ali: How to solve the problem of MQ message loss, duplication and backlog?
最后写入胜利(丢弃并发写入)
How to switch remote server in gerrit
【Yugong Series】July 2022 Go Teaching Course 022-Dictionary of Go Containers
【Yugong Series】July 2022 Go Teaching Course 021-Slicing Operation of Go Containers
How C programs run 01 - the composition of ordinary executable files
Flutter 获取状态栏statusbar的高度
2022年Android 面经总结(附含面试题 | 源码 | 面试资料)
牛客 HJ17 坐标移动









