当前位置:网站首页>spark资源调度和任务调度
spark资源调度和任务调度
2022-08-02 14:05:00 【boyzwz】
spark架构
术语解释
spark on yarn-client模式资源调度和任务调度
一个action算子触发一个job任务
资源调度
1、client模式,在本地启动Driver程序
2、向RS(ResourceManager)发送请求,启动AM(ApplicationMaster)的资源
3、AM随机选定一个节点启动AM
4、AM向RM申请资源,用于启动executor
5、RM分配一批节点,AM向NM发送命令启动executor
6、executor反向注册给Driver端
任务调度
1、当遇到action算子时,触发一个job,开始执行任务调度
2、DAG Scheduler基于Stage构建DAG有向无环图
3、DAG Scheduler根据宽窄依赖将DAG切分成多个Stage(Stage:由多个并行计算的task组成)
4、将Stage以TaskSet的形式发送给Task Scheduler
5、Task Scheduler将TaskSet中的task发送给executor中执行(会尽量发送到数据所在节点的executor上执行)
spark on yarn-cluster模式即在本地提交Spark Application后,Driver会和AM运行在同一节点上。
- ApplicationMaster的作用:
- 为当前的Application申请资源
- 给NameNode发送消息启动Executor。
注意:ApplicationMaster有launchExecutor和申请资源的功能,并没有作业调度的功能。
但当以yarn-cluster模式执行时,AM有任务调度的作用,因为Driver和AM在同一节点了
spark Stand alone模式
可以查看Spark中Standalone的两种提交模式(Standalone-client模式与Standalone-cluster模式) - 爱码网
边栏推荐
猜你喜欢
随机推荐
verilog学习|《Verilog数字系统设计教程》夏宇闻 第三版思考题答案(第十四章)
C语言日记 5 运算符和表达式
Using the cloud GPU + pycharm training model to realize automatic background run programs, save training results, the server automatically power off
C语言初级—用一角,两角,五角和一元组成3.5元有多少种组合方法
Flask framework in-depth
MySQL 8.0 新特性
Tornado framework routing system introduction and (IOloop.current().start()) start source code analysis
Verilog学习 系列
8580 Merge linked list
YOLOv7使用云GPU训练自己的数据集
十分钟带你入门Nodejs
无人驾驶综述:国外国内发展历程
什么是闭包?闭包的作用?闭包的应用?有什么缺点?
Unit 11 Serializers
Web Design (Beginners) [easy to understand]
drf source code analysis and global catch exception
Creating seven NiuYun Flask project complete and let cloud
Ehcache基础学习
C语言日记 7 输入/输出格式控制
原码、反码、补码和移码