当前位置:网站首页>spark报错OutOfMemory「建议收藏」
spark报错OutOfMemory「建议收藏」
2022-07-31 16:53:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
最近在使用spark进行分析的时候 几千万的数据量感觉不多 但是跑起来非常慢
内存溢出OutOfMemory
1.然后在有使用map的地方 在map之前进行分区repartition
2.join会有shuffle产生 shuffle也会产生数据溢出
3.map也可以换成 mapPartitions 并且适当调整分区数 200 400
其他的还有很多 我用的就这些 然后任务可以跑出来。
还有什么错误 比如 reset by peer还有什么255的错误
报错信息没有记录
然后使用配置文件去调整
config.set("spark.network.timeout","100000")
config.set("spark.executor.heartbeatInterval","100s")
config.set("spark.executor.memory", "50g")
config.set("spark.shuffle.blockTransferService", "nio")没用
主要是代码问题。。。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/127866.html原文链接:https://javaforall.cn
边栏推荐
- 牛客 HJ19 简单错误记录
- Flutter gets the height of the status bar statusbar
- Golang 小数操作之判断几位小数点与四舍五入
- 【C语言】LeetCode27.移除元素
- 利用PHP开发具有注册、登陆、文件上传、发布动态功能的网站
- A common method and the use of selenium
- Flutter 获取状态栏statusbar的高度
- Implementing distributed locks based on Redis (SETNX), case: Solving oversold orders under high concurrency
- 【Yugong Series】July 2022 Go Teaching Course 020-Array of Go Containers
- TestCafe总结
猜你喜欢
随机推荐
Kotlin协程:续体、续体拦截器、调度器
自动化测试—web自动化—selenium初识
LeetCode_733_Image rendering
上传图片-微信小程序(那些年的坑记录2022.4)
[TypeScript] In-depth study of TypeScript type operations
你辛辛苦苦写的文章可能不是你的原创
Automated testing - web automation - first acquaintance with selenium
Small program: Matlab solves differential equations "recommended collection"
MySQL common statements
Handling write conflicts under multi-master replication (3) - Convergence to a consistent state and custom conflict resolution logic
js的toString方法
认识异常 (看完这篇你就懂了)
jeecg master-slave database read-write separation configuration "recommended collection"
Graham‘s Scan法求解凸包问题
How to install CV2 smoothly in Anaconda
【愚公系列】2022年07月 Go教学课程 022-Go容器之字典
Introduction of Jerry voice chip ic toy chip ic_AD14NAD15N full series development
牛客网刷题(三)
并发性,时间和相对性
Golang 必知必会Go Mod命令
![[pytorch] 1.7 pytorch and numpy, tensor and array conversion](/img/ca/b943ff8f59f08e9e23b1ba416c79a0.png)








