当前位置:网站首页>Explanation of spark operator
Explanation of spark operator
2022-08-04 08:32:00 【这是一本书】
1 Background
An important feature of writing spark programs is based on operator development
Each operator has its own characteristics and uses
A certain type of operator is the performance bottleneck
2 Categories
There are two main categories of spark operators

3 Transformation
3.1 Introduction
Used to transform RDDs
Every Transformation operation will generate a new RDD
This operation is delayed in execution
4 Action
4.1 Introduction
Used to trigger the calculation of RDD; get relevant calculation results or save the results in an external system
5 Summary of the characteristics of the two
Transformation is asynchronous and does not affect performance
Returns the result int, double, and set (will not return a new RDD). When encountering an Action operation, it starts from the source of the lineage and performs physical conversion operations, so the operator of Action consumes performance
/p>
边栏推荐
- Linux之Redis 缓存雪崩,击穿,穿透
- 微信消息从发送到接收,经历了什么?如何防止丢包
- 【NOI模拟赛】纸老虎博弈(博弈论SG函数,长链剖分)
- 智能健身动作识别:PP-TinyPose打造AI虚拟健身教练!
- redis---分布式锁存在的问题及解决方案(Redisson)
- <jsp:useBean>动作的使用
- 2022的七夕,奉上7个精美的表白代码,同时教大家改源码快速自用
- GIS数据与CAD数据间带属性字段互相转换还原工具,解决ArcGIS等软件进行GIS数据转CAD数据无法保留属性字段问题
- 1161. Maximum Level Sum of a Binary Tree
- 在安装GBase 8c数据库的时候,报错显示“Host ips belong to different cluster”。这是为什么呢?有什么解决办法?
猜你喜欢

给Unity Behavior Designer(Unity行为树) 的Can See Object 画圆锥辅助图

金仓数据库 KDTS 迁移工具使用指南 (5. SHELL版使用说明)

2022-08-02 分析RK817 输出32k clock PMIC_32KOUT_WIFI给WiFi模块 clock 注册devm_clk_hw_register

JNI学习1.环境配置与简单函数实现

binder通信实现

25.时间序列预测实战

Typora_Markdown_图片标题(题注)

【高并发基石】多线程、守护线程、线程安全、线程同步、互斥锁

Thread类的基本使用。

经典递归回溯问题之——解数独(LeetCode 37)
随机推荐
Shared_preload_libraries导致很多语法不支持
如何设计一个注册中心
金仓数据库KingbaseES客户端编程接口指南-JDBC(6. JDBC 大对象数据处理)
使用单调栈解决接雨水问题——LeetCode 42 接雨水+单调栈说明
【JS 逆向百例】某网站加速乐 Cookie 混淆逆向详解
MySQL group_concat()详解
LeetCode 97. 交错字符串
sql在字段重复时 对某个字段根据最新时间取数
GBase 8c数据库集群中,怎么替换节点呢?比如设置A节点为gtm,换到B节点上。
MySQL 8.0.29 详细安装(windows zip版)
华为设备配置VRRP与NQA联动监视上行链路
【UE虚幻引擎】UE5三步骤实现AI漫游与对话行为
layout manager
Libpq 是否支持读写分离配置
C语言strchr()函数以及strstr()函数的实现
设计信息录入界面,完成人员基本信息的录入工作,
YOLOv5应用轻量级通用上采样算子CARAFE
leetcode 22.8.1 二进制加法
Distributed Computing Experiment 1 Load Balancing
虚拟机没有USB网卡选项怎么解决