当前位置:网站首页>spark入门学习-2
spark入门学习-2
2022-08-03 15:48:00 【@Autowire】
1 依赖关系



宽依赖:有shuffle
父RDD的一个分区会被子RDD的多个分区所依赖
窄依赖:没有shuffle
父RDD的一个分区只会被子RDD的1个分区所依赖
总结:
窄依赖:并行化+容错
宽依赖:进行阶段划分(shuffle后的阶段需要等待shuffle才能执行.
2 DAG && Stage


Spark的DAG:就是spark任务/程序执行的流程图!
DAG的开始:从创建RDD开始
DAG的结束:到Action结束
一个Spark程序中由有几个Ation操作就有几个DAG
Stage:是DAG中根据shuffle划分出来的阶段!
前面的阶段执行完才可以执行后面的阶段.
同一个阶段中的各个任务可以并行执行无需等待!
3 名词解释




4 Job提交流程

边栏推荐
- 2021年12月电子学会图形化三级编程题解析含答案:分身术
- Research on power flow in DC microgrid based on Newton's method (Matlab code implementation)
- How to play deep paging with hundreds of millions of data?Compatible with MySQL + ES + MongoDB
- 2021年12月电子学会图形化四级编程题解析含答案:新冠疫苗接种系统
- A new round of competition for speech recognition has started. Will natural dialogue be the next commanding height?
- 红蓝对抗经验分享:CS免杀姿势
- 每日练习------有10个数字要求分别用选择法从大到小输出
- ruoyi若依框架@DataScope注解使用以及碰到的一些问题
- 土耳其国防部:联合协调中心将对首艘乌克兰粮船进行安全检查
- Essentially a database data recovery 】 【 database cannot read data recovery case
猜你喜欢
随机推荐
深入浅出Flask PIN
[微信小程序开发者工具] × #initialize
49 万奖金等你来拿!第四届实时计算 Flink 挑战赛启动,Beyond Stream Processing!
js中的基础知识点 —— 事件
JS basics--judgment
红蓝对抗经验分享:CS免杀姿势
语音识别新一轮竞争打响,自然对话会是下一个制高点吗?
2021年12月电子学会图形化二级编程题解析含答案:消灭蝙蝠
AI+BI+可视化,Sugar BI架构深度剖析
How Navicat connects to MySQL on a remote server
NodeJs - cross domain
泰山OFFICE技术讲座:段落边框的绘制难点在哪里?
新一代网状网协议T-Mesh无线通信技术优势介绍
MySQL性能优化_小表驱动大表
出海季,互联网出海锦囊之本地化
Ruoyi Ruoyi framework @DataScope annotation use and some problems encountered
ModelWhale 云端运行 WRF 中尺度数值气象模式,随时随地即开即用的一体化工作流
Three key expectations for the crypto market in August Price moves north?Still expected to be in turmoil
动态链接库.dll、.so和静态库.a,cmake指令
实习路途:记录给我的第一个实习项目中的困惑









