当前位置:网站首页>spark资源调度和任务调度
spark资源调度和任务调度
2022-08-02 14:05:00 【boyzwz】
spark架构
术语解释
spark on yarn-client模式资源调度和任务调度
一个action算子触发一个job任务
资源调度
1、client模式,在本地启动Driver程序
2、向RS(ResourceManager)发送请求,启动AM(ApplicationMaster)的资源
3、AM随机选定一个节点启动AM
4、AM向RM申请资源,用于启动executor
5、RM分配一批节点,AM向NM发送命令启动executor
6、executor反向注册给Driver端
任务调度
1、当遇到action算子时,触发一个job,开始执行任务调度
2、DAG Scheduler基于Stage构建DAG有向无环图
3、DAG Scheduler根据宽窄依赖将DAG切分成多个Stage(Stage:由多个并行计算的task组成)
4、将Stage以TaskSet的形式发送给Task Scheduler
5、Task Scheduler将TaskSet中的task发送给executor中执行(会尽量发送到数据所在节点的executor上执行)
spark on yarn-cluster模式即在本地提交Spark Application后,Driver会和AM运行在同一节点上。
- ApplicationMaster的作用:
- 为当前的Application申请资源
- 给NameNode发送消息启动Executor。
注意:ApplicationMaster有launchExecutor和申请资源的功能,并没有作业调度的功能。
但当以yarn-cluster模式执行时,AM有任务调度的作用,因为Driver和AM在同一节点了
spark Stand alone模式
可以查看Spark中Standalone的两种提交模式(Standalone-client模式与Standalone-cluster模式) - 爱码网
边栏推荐
猜你喜欢
getUserProfile接口不显示用户性别和地区
Unit 8 Middleware
[ROS] (02) Create & compile ROS package Package
redis基础
主存储器(二)
Using the cloud GPU + pycharm training model to realize automatic background run programs, save training results, the server automatically power off
[ROS] Introduction to common tools in ROS (to be continued)
C语言一维数组练习——将一个字符串中的某个字符替换成其它字符
Flink前期代码结构
C语言日记 2 标识符
随机推荐
C语言字符串——关于指针
宝塔搭建PHP自适应懒人网址导航源码实测
C语言初级—判断一个数是不是素数(函数封装)
Linux: CentOS 7 install MySQL5.7
C语言初级—数组元素的增删改查
verilog学习|《Verilog数字系统设计教程》夏宇闻 第三版思考题答案(第十二章)
ThinkPHP5.0内置分页函数Paginate无法获取POST页数问题的解决办法
Unit 10 Continuous Tuning
Implementation of redis distributed lock and watchdog
C语言日记 4 变量
C语言初级—常见问题(100~200素数,计算1+11+111+...,从键盘获取一个数并输出有几个位)
Redis-01-Nosql概述
C语言日记 1“Hello world“
uniCloud 未能获取当前用户信息:30205 | 当前用户为匿名身份
YOLOv7 uses cloud GPU to train its own dataset
PHP open source customer service system _ online customer service source code PHP
C语言日记 2 标识符
Unit 14 Viewsets and Routing
重新学习编程day1 【初始c语言】【c语言编写出计算两个数之和的代码】
MySQL知识总结 (十) 一条 SQL 的执行过程详解