当前位置:网站首页>spark入门学习-2
spark入门学习-2
2022-08-03 15:48:00 【@Autowire】
1 依赖关系



宽依赖:有shuffle
父RDD的一个分区会被子RDD的多个分区所依赖
窄依赖:没有shuffle
父RDD的一个分区只会被子RDD的1个分区所依赖
总结:
窄依赖:并行化+容错
宽依赖:进行阶段划分(shuffle后的阶段需要等待shuffle才能执行.
2 DAG && Stage


Spark的DAG:就是spark任务/程序执行的流程图!
DAG的开始:从创建RDD开始
DAG的结束:到Action结束
一个Spark程序中由有几个Ation操作就有几个DAG
Stage:是DAG中根据shuffle划分出来的阶段!
前面的阶段执行完才可以执行后面的阶段.
同一个阶段中的各个任务可以并行执行无需等待!
3 名词解释




4 Job提交流程

边栏推荐
猜你喜欢

如何将二维空间先验注入到ViT中? UMA&港理工&阿里提出SP-ViT,为视觉Transformer学习2D空间先验知识!...

STM32 GPIO LED和蜂鸣器实现【第四天】
![[微信小程序开发者工具] × #initialize](/img/38/ea90525f53de3933a808f0d75028b0.png)
[微信小程序开发者工具] × #initialize

开源一夏 | 阿里云物联网平台之极速体验

Daily practice------There are 10 numbers that are required to be output from large to small by selection method

Js array method is summarized

如何选择合适的损失函数,请看......

用友YonSuite与旺店通数据集成对接-技术篇2

Neural networks, cool?

出海季,互联网出海锦囊之本地化
随机推荐
nodeJs--跨域
如何选择合适的损失函数,请看......
ECCV 2022 | Relational Query-Based Temporal Action Detection Methods
瞌睡检测系统介绍
No inner demons, to dry!SQL optimization and diagnosis
冒烟测试冒烟测试
Reptile attention
新版本的 MaxCompute 中,SQL支持的 LIMIT OFFSET 的语法是什么功能?
简介undo log、truncate、以及undo log如何帮你回滚事物?
6000 字+,帮你搞懂互联网架构演变历程!
13、OOM模拟
小熊派——无线联网开发
随笔-UGUI中LayoutGroup来自适应长度图片长度
2021年12月电子学会图形化一级编程题解析含答案:放学
随笔-Unity中一个简易的Spine动画控制器
人脸识别损失函数的汇总 | Pytorch版本实现
MySQL中的基数是啥?
深度学习——安装CUDA以及CUDNN实现tensorflow的GPU运行
GTK实现旋转加载动画
生物统计师与临床医生协同研究使用的低代码洞察平台丨数据科学 x 临床医学