当前位置:网站首页>spark中Repartition 和 Coalesce 区别
spark中Repartition 和 Coalesce 区别
2022-08-03 05:32:00 【贾斯汀玛尔斯】
关系: 两者都是用来改变 RDD 的 partition 数量的,repartition 底层调用的就是 coalesce 方法: coalesce(numPartitions, shuffle = true)
区别: repartition 一定会发生 shuffle,coalesce 根据传入的参数来判断是否发生 shuffle 一般情况下增大 rdd 的 partition 数量使用 repartition,减少 partition 数量时使用 coalesce
边栏推荐
猜你喜欢
随机推荐
如何使用md5码验证文件的一致性
ES6 - 剩余参数,Array的扩展方法,String的扩展方法
C # program with administrator rights to open by default
MySQL中的行锁
【OpenStack云平台】搭建openstack云平台
SQL——左连接(Left join)、右连接(Right join)、内连接(Inner join)
QT 连续生成指定范围内不重复的随机值
Mysql去除重复数据
AR路由器如何配置Portal认证(二层网络)
npx 有什么作用跟意义?为什么要有 npx?什么场景使用?
Oracle 11g silent install
Detailed explanation of AutoInt network and pytorch reproduction
PCB 多层板为什么都是偶数层?
零代码工具拖拽流程图
CCF NOI 2022笔试题库
nvm 卸载详细流程
ClickHouse删除数据之delete问题详解
【干货分享】PCB 板变形原因!不看不知道
el-tabs(标签栏)的入门学习
mysql 数据去重的三种方式[实战]









