当前位置:网站首页>spark入门学习-2
spark入门学习-2
2022-08-03 15:48:00 【@Autowire】
1 依赖关系
宽依赖:有shuffle
父RDD的一个分区会被子RDD的多个分区所依赖
窄依赖:没有shuffle
父RDD的一个分区只会被子RDD的1个分区所依赖
总结:
窄依赖:并行化+容错
宽依赖:进行阶段划分(shuffle后的阶段需要等待shuffle才能执行.
2 DAG && Stage
Spark的DAG:就是spark任务/程序执行的流程图!
DAG的开始:从创建RDD开始
DAG的结束:到Action结束
一个Spark程序中由有几个Ation操作就有几个DAG
Stage:是DAG中根据shuffle划分出来的阶段!
前面的阶段执行完才可以执行后面的阶段.
同一个阶段中的各个任务可以并行执行无需等待!
3 名词解释
4 Job提交流程
边栏推荐
- After the cnpm installation is successful, the prompt is not an internal and external command, nor is it a runnable command solution
- 您的移动端app安全吗
- leetcode-105 从前序与中序遍历序列构造二叉树-使用栈代替递归
- 兔起鹘落全端涵盖,Go lang1.18入门精炼教程,由白丁入鸿儒,全平台(Sublime 4)Go lang开发环境搭建EP00
- 一个文件管理系统的软硬件配置清单
- The general trend, another key industry related to Sino-US competition, has reached a critical moment
- AI也有健忘症?英国41岁教授专访:解决灾难性遗忘
- 随笔-UGUI中LayoutGroup来自适应长度图片长度
- 语音识别新一轮竞争打响,自然对话会是下一个制高点吗?
- 无内鬼,来点干货!SQL优化和诊断
猜你喜欢
随机推荐
基于牛顿方法在直流微电网潮流研究(Matlab代码实现)
扫雷?拿来吧你(递归展开+坐标标记)
js数组方法总结
Ark server opening tutorial win
如何选择合适的损失函数,请看......
新版本MaxCompute 的SQL支持 UDF 分区裁剪的逻辑是怎样的?
0 code 4 steps to experience IoT devices on the cloud
爬虫注意
动态链接库.dll、.so和静态库.a,cmake指令
The general trend, another key industry related to Sino-US competition, has reached a critical moment
产品以及研发团队有使用专业的办公软件,如禅道、蓝湖等,他们应该如何使用 Tita 系统?
【899. 有序队列】
Reptile attention
AWS China SDN Connector
下午见!2022京东云数据库新品发布会
2021年12月电子学会图形化三级编程题解析含答案:数星星
使用VS Code搭建ESP-IDF环境
请问下,flink cdc监控oracle,我看源码是通过sid方式的,请问怎么改成service
新一代网状网协议T-Mesh无线通信技术优势介绍
每日练习------有10个数字要求分别用选择法从大到小输出