当前位置:网站首页>spark入门学习-2
spark入门学习-2
2022-08-03 15:48:00 【@Autowire】
1 依赖关系



宽依赖:有shuffle
父RDD的一个分区会被子RDD的多个分区所依赖
窄依赖:没有shuffle
父RDD的一个分区只会被子RDD的1个分区所依赖
总结:
窄依赖:并行化+容错
宽依赖:进行阶段划分(shuffle后的阶段需要等待shuffle才能执行.
2 DAG && Stage


Spark的DAG:就是spark任务/程序执行的流程图!
DAG的开始:从创建RDD开始
DAG的结束:到Action结束
一个Spark程序中由有几个Ation操作就有几个DAG
Stage:是DAG中根据shuffle划分出来的阶段!
前面的阶段执行完才可以执行后面的阶段.
同一个阶段中的各个任务可以并行执行无需等待!
3 名词解释




4 Job提交流程

边栏推荐
猜你喜欢
随机推荐
深度学习——安装CUDA以及CUDNN实现tensorflow的GPU运行
兔起鹘落全端涵盖,Go lang1.18入门精炼教程,由白丁入鸿儒,全平台(Sublime 4)Go lang开发环境搭建EP00
Three key expectations for the crypto market in August Price moves north?Still expected to be in turmoil
开源一夏 | 打工人的第25天-曾经的考研人
新一代网状网协议T-Mesh无线通信技术优势介绍
1、实例开启无锁表结构变更以后,在任务编排中通过“单实例SQL”节点进行的结构变更,是优先采用无锁表
开源一夏 | 阿里云物联网平台之极速体验
Js array method is summarized
2021年12月电子学会图形化四级编程题解析含答案:聪明的小猫
【数据库数据恢复】SqlServer数据库无法读取的数据恢复案例
下午见!2022京东云数据库新品发布会
请问下,flink cdc监控oracle,我看源码是通过sid方式的,请问怎么改成service
Neural networks, cool?
Go Go 简单的很,标准库之 fmt 包的一键入门
方舟开服教程win
JD6606SP5_JD6606SSP_JD6606SASP_JD6621W7百盛新纪元授权代理商
unity用代码生成LightProbeGroup
Phaser(二):小恐龙跑酷游戏
How much does Ark Survival Evolved cost?
AI也有健忘症?英国41岁教授专访:解决灾难性遗忘









