当前位置:网站首页>spark算子讲解
spark算子讲解
2022-08-04 08:28:00 【this is a book】
1 背景
写spark 程序重要特性就是基于算子开发
每一个算子都有自己的特性和用途
某一类算子是性能瓶颈的所在
2 分类
spark 算子有两种主要的分类

3 Transformation
3.1 简介
用来对RDD进行转化
每一次 Transformation 操作都会产生新的RDD
这个操作时延迟执行的
4 Action
4.1 简介
用来触发RDD的计算;得到相关计算结果 或者 将结果保存的外部系统中
5 两者特点总结
Transformation 是异步的,并不会影响性能
返回结果int、double、集合(不会返回新的RDD),遇到 Action 操作时,开始从血 缘关系(lineage)源头开始,进行物理的转换操作所以Action的算子是消耗性能的
边栏推荐
猜你喜欢
随机推荐
微信消息从发送到接收,经历了什么?如何防止丢包
关于Oracle RAC 11g重建磁盘组的问题
The difference between character stream and byte stream
一天学会JDBC06:PrepaerdStatemtnt
预测性维护学习之路
金仓数据库 KDTS 迁移工具使用指南 (5. SHELL版使用说明)
C# DirectoryInfo类
ShuffleNet v2网络结构复现(Pytorch版)
DWB主题事实及ST数据应用层构建,220803,,
unittest使用简述
高等代数_证明_对称矩阵一定能够相似对角化
【Attention】Dual Attention(DANet) & Fully Attention(FLA)
线程和进程之间的区别
unity3d-Animation&&Animator接口(基本使用)
inject() can only be used inside setup() or functional components.
给Unity Behavior Designer(Unity行为树) 的Can See Object 画圆锥辅助图
占位,稍后补上
2022的七夕,奉上7个精美的表白代码,同时教大家改源码快速自用
leetcode 22.8.1 二进制加法
研究性学习专题 3_LL(1)语法分析设计原理与实现









