当前位置:网站首页>spark资源调度和任务调度
spark资源调度和任务调度
2022-08-02 14:05:00 【boyzwz】
spark架构

术语解释

spark on yarn-client模式资源调度和任务调度

一个action算子触发一个job任务
资源调度
1、client模式,在本地启动Driver程序
2、向RS(ResourceManager)发送请求,启动AM(ApplicationMaster)的资源
3、AM随机选定一个节点启动AM
4、AM向RM申请资源,用于启动executor
5、RM分配一批节点,AM向NM发送命令启动executor
6、executor反向注册给Driver端
任务调度
1、当遇到action算子时,触发一个job,开始执行任务调度
2、DAG Scheduler基于Stage构建DAG有向无环图
3、DAG Scheduler根据宽窄依赖将DAG切分成多个Stage(Stage:由多个并行计算的task组成)
4、将Stage以TaskSet的形式发送给Task Scheduler
5、Task Scheduler将TaskSet中的task发送给executor中执行(会尽量发送到数据所在节点的executor上执行)
spark on yarn-cluster模式即在本地提交Spark Application后,Driver会和AM运行在同一节点上。
- ApplicationMaster的作用:
- 为当前的Application申请资源
- 给NameNode发送消息启动Executor。
注意:ApplicationMaster有launchExecutor和申请资源的功能,并没有作业调度的功能。
但当以yarn-cluster模式执行时,AM有任务调度的作用,因为Driver和AM在同一节点了
spark Stand alone模式
可以查看Spark中Standalone的两种提交模式(Standalone-client模式与Standalone-cluster模式) - 爱码网
边栏推荐
- 【c】大学生在校学习c语言常见代码
- Introduction and use of Haystack
- 函数递归和动态内存初识
- verilog学习|《Verilog数字系统设计教程》夏宇闻 第三版思考题答案(第十四章)
- Linux: CentOS 7 install MySQL5.7
- Verilog Learning Series
- Steps to connect the virtual machine with xshell_establish a network connection between the host and the vm virtual machine
- verilog学习|《Verilog数字系统设计教程》夏宇闻 第三版思考题答案(第九章)
- 我理解的学习金字塔
- ABP,kendo后台接口,新增,查询
猜你喜欢
随机推荐
C语言日记 5 运算符和表达式
华为防火墙
MySQL知识总结 (二) 存储引擎
鼠标右键菜单栏太长如何减少
C语言——断言assert的使用
redis基础
Flink前期代码结构
MySQL知识总结 (十) 一条 SQL 的执行过程详解
MySQL知识总结 (九) 用户与用户权限管理
St. Regis Takeaway Notes - Lecture 05 Getting Started with Redis
C语言一维数组练习——将m个元素移动到数组尾部
ng-style:动态控制样式
C语言——一级指针初识
getUserProfile接口不显示用户性别和地区
C语言日记 6 基本输入/输出
C语言一维数组练习——将一个字符串中的某个字符替换成其它字符
Caused by: org.gradle.api.internal.plugins.PluginApplicationException: Failed to apply plugin [id ‘c
Building and getting started with the Flask framework
宝塔搭建DM企业建站系统源码实测
Flask request application context source code analysis









