当前位置:网站首页>spark中Repartition 和 Coalesce 区别
spark中Repartition 和 Coalesce 区别
2022-08-03 05:32:00 【贾斯汀玛尔斯】
关系: 两者都是用来改变 RDD 的 partition 数量的,repartition 底层调用的就是 coalesce 方法: coalesce(numPartitions, shuffle = true)
区别: repartition 一定会发生 shuffle,coalesce 根据传入的参数来判断是否发生 shuffle 一般情况下增大 rdd 的 partition 数量使用 repartition,减少 partition 数量时使用 coalesce
边栏推荐
猜你喜欢
随机推荐
【nohup】nohup命令的简单使用
MySQL的 DDL和DML和DQL的基本语法
一篇文章教你写扫雷(c语言基础版)
cnpm的安装与使用
JDBC从手写连接到引用DBCP和C3P0
Chrome插件开发入门
你真的了解volatile关键字吗?
一文读懂PCB品质体系认证
MySQL的触发器
ClickHouse 数据插入、更新与删除操作 SQL
高密度 PCB 线路板设计中的过孔知识
UniApp scroll-view 事件不生效(@scroll、@scrolltolower、@scrolltoupper ...)
MySQL 操作语句大全(详细)
2021新版idea过滤无用文件.idea .iml
零代码工具拖拽流程图
DIFM network, rounding and repetition
MySQL的10种常用数据类型
Getting started with el-tabs (tab bar)
SQL——左连接(Left join)、右连接(Right join)、内连接(Inner join)
nvm 卸载详细流程









