当前位置:网站首页>spark架构
spark架构
2022-08-02 07:00:00 【this is a book】
1 背景
基于spark开发都是使用spark框架,在上面做业务层面开发,了解spark的基本架构
可以快速掌握spark的使用技巧
2 架构图
3 术语讲解
3.1 Cluster Manager
是集群资源的管理者,可以理解为spark的运行底座,所有代码都是跑在上面的
Spark支持3种集群部署模式: Standalone、Yarn、Mesos
3.2 Driver Program
spark程序里面的main方法
创建了 SparkContext,SparkContext 发送 Task 到 Executor 上执行
这里面就讲一个点,Driver Program的JVM和Executor不共享一个JVM,甚至不在一台机器
3.3 Executor
代码中执行算子的代码区域
在工作节点上运行,执行 Driver 发送的 Task
并向 Driver Manager 返回运算结果
边栏推荐
猜你喜欢
随机推荐
第06章 索引的数据结构【2.索引及调优篇】【MySQL高级】
sql 远程访问链接服务器
概率论与数理统计
MPLS的相关技术
反射课后习题及做题记录
修改apt-get源为国内镜像源
“蔚来杯“2022牛客暑期多校训练营4,签到题NDKHL
OC-范畴
飞桨paddle技术点整理
yml字符串读取时转成数字了怎么解决
OC-NSDictionary
企业实训复现指导手册——基于华为ModelArts平台的OpenPose模型的训练和推理、基于关键点数据实现对攀爬和翻越护栏两种行为的识别、并完成在图片中只标注发生行为的人
张驰咨询:企业实施精益管理的最大障碍,只把精益作为一种工具和方法
Resolving C# non-static field, method or property "islandnum.Program.getIslandCount(int[][], int, int)" requires an object reference
OC-NSArray
查找最大的n个文件
论文《Deep Multifaceted Transformers for Multi-objective Ranking in Large-Scale E-commerce Recommender》
分离轴定理SAT凸多边形精确碰撞检测
【心电信号】基于matlab心率检测【含Matlab源码 1993期】
实例029:反向输出