当前位置:网站首页>spark报错OutOfMemory「建议收藏」
spark报错OutOfMemory「建议收藏」
2022-07-31 16:53:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
最近在使用spark进行分析的时候 几千万的数据量感觉不多 但是跑起来非常慢
内存溢出OutOfMemory
1.然后在有使用map的地方 在map之前进行分区repartition
2.join会有shuffle产生 shuffle也会产生数据溢出
3.map也可以换成 mapPartitions 并且适当调整分区数 200 400
其他的还有很多 我用的就这些 然后任务可以跑出来。
还有什么错误 比如 reset by peer还有什么255的错误
报错信息没有记录
然后使用配置文件去调整
config.set("spark.network.timeout","100000")
config.set("spark.executor.heartbeatInterval","100s")
config.set("spark.executor.memory", "50g")
config.set("spark.shuffle.blockTransferService", "nio")没用
主要是代码问题。。。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/127866.html原文链接:https://javaforall.cn
边栏推荐
- 你辛辛苦苦写的文章可能不是你的原创
- How Redis handles concurrent access
- Golang go-redis cluster模式下不断创建新连接,效率下降问题解决
- 20.支持向量机—数学原理知识
- 自动化测试—web自动化—selenium初识
- 6. 使用 Postman 工具高效管理和测试 SAP ABAP OData 服务
- Flink_CDC搭建及简单使用
- Intelligent bin (9) - vibration sensor (raspberries pie pico implementation)
- 动态规划之线性dp(下)
- Flutter gets the height of the status bar statusbar
猜你喜欢
随机推荐
最新神作!阿里巴巴刚出炉的面试参考指南(泰山版),我直接狂刷29天
iNeuOS工业互联网操作系统,设备运维业务和“低代码”表单开发工具
Mariabackup implements incremental data backup for Mariadb 10.3
【愚公系列】2022年07月 Go教学课程 020-Go容器之数组
【Yugong Series】July 2022 Go Teaching Course 021-Slicing Operation of Go Containers
How C programs run 01 - the composition of ordinary executable files
Golang go-redis cluster模式下不断创建新连接,效率下降问题解决
GP 6总体架构学习笔记
AcWing 1282. 搜索关键词 题解((AC自动机)Trie+KMP)+bfs)
2020 WeChat applet decompilation tutorial (can applet decompile source code be used)
[pytorch] 1.7 pytorch and numpy, tensor and array conversion
你辛辛苦苦写的文章可能不是你的原创
Combinatorics Notes (6) Associative Algebra of Locally Finite Partially Ordered Sets, Möbius Inversion Formula
js的toString方法
并发性,时间和相对性
The new telecom "routine", my dad was tricked!
Flink_CDC搭建及简单使用
华为手机一键开启“维修模式”隐藏所有数据,让手机隐私更加安全
Introduction of Jerry voice chip ic toy chip ic_AD14NAD15N full series development
IP protocol from 0 to 1
![[TypeScript]OOP](/img/d7/b3175ab538906ac1b658a9f361ba44.png)








