当前位置:网站首页>spark调优(一):从hql转向代码
spark调优(一):从hql转向代码
2022-07-05 10:58:00 【InfoQ】
1. 起因
SELECT id,name,
max(score1),
sum(score2),
avg(score3)
FROM table
GROUP BY id,name
snappy压缩,原始数据500G
280亿条数据
第一步Shuffle Write 800G
接下来的任务预估需要8个小时跑完
2.优化开始
--conf spark.storage.memoryFraction=0.7
--conf spark.executor.heartbeatInterval=240
--conf spark.locality.wait=60
-XX:+UseG1GC
dataset.repartition(20000)
3. 问题解决
Dataset<Row> ds = spark.sql(sql);
dsTag0200.javaRDD().mapPartitionsToPair(
数据转型
分组当key做成tuple2
此处我缓存了一些需要后面聚合的差值
).reduceByKey(
判断最大最小
sum的聚合操作使用差值直接聚合
一遍就可以直接输出最终结果
)
4 总结
结束语
边栏推荐
- 小红书自研KV存储架构如何实现万亿量级存储与跨云多活
- SQL Server monitoring statistics blocking script information
- 四部门:从即日起至10月底开展燃气安全“百日行动”
- 【Oracle】使用DataGrip连接Oracle数据库
- regular expression
- Deepfake tutorial
- Lombok makes ⽤ @data and @builder's pit at the same time. Are you hit?
- 关于vray 5.2的使用(自研笔记)
- Wechat nucleic acid detection appointment applet system graduation design completion (7) Interim inspection report
- A usage example that can be compatible with various database transactions
猜你喜欢
Broyage · fusion | savoir que le site officiel de chuangyu mobile end est en ligne et commencer le voyage de sécurité numérique!
如何让全彩LED显示屏更加节能环保
DDR4的特性与电气参数
Go language learning notes - first acquaintance with go language
关于vray 5.2的使用(自研笔记)
Detailed explanation of MATLAB cov function
数据库三大范式
在C# 中实现上升沿,并模仿PLC环境验证 If 语句使用上升沿和不使用上升沿的不同
DGL中的消息传递相关内容的讲解
Do you really understand the things about "prototype"? [part I]
随机推荐
Web3 Foundation grant program empowers developers to review four successful projects
Lombok 同时使⽤@Data和@Builder 的坑,你中招没?
iframe
The art of communication III: Listening between people
Basic testing process of CSDN Software Testing Introduction
磨砺·聚变|知道创宇移动端官网焕新上线,开启数字安全之旅!
PWA (Progressive Web App)
[first release in the whole network] (tips for big tables) sometimes it takes only 1 minute for 2 hours of SQL operation
中职组网络安全2021年江苏省省赛题目5套题目环境+解析全有需要的私信我
Broyage · fusion | savoir que le site officiel de chuangyu mobile end est en ligne et commencer le voyage de sécurité numérique!
DGL中的消息传递相关内容的讲解
在C# 中实现上升沿,并模仿PLC环境验证 If 语句使用上升沿和不使用上升沿的不同
购买小间距LED显示屏的三个建议
Do you really understand the things about "prototype"? [part I]
Go project practice - parameter binding, type conversion
MFC pet store information management system
Msfconsole command encyclopedia and instructions
Scaffold development foundation
Wechat nucleic acid detection appointment applet system graduation design completion (6) opening defense ppt
Lazy loading scheme of pictures