当前位置:网站首页>Explanation of spark operator
Explanation of spark operator
2022-08-04 08:32:00 【这是一本书】
1 Background
An important feature of writing spark programs is based on operator development
Each operator has its own characteristics and uses
A certain type of operator is the performance bottleneck
2 Categories
There are two main categories of spark operators
3 Transformation
3.1 Introduction
Used to transform RDDs
Every Transformation operation will generate a new RDD
This operation is delayed in execution
4 Action
4.1 Introduction
Used to trigger the calculation of RDD; get relevant calculation results or save the results in an external system
5 Summary of the characteristics of the two
Transformation is asynchronous and does not affect performance
Returns the result int, double, and set (will not return a new RDD). When encountering an Action operation, it starts from the source of the lineage and performs physical conversion operations, so the operator of Action consumes performance
/p>
边栏推荐
- 金仓数据库KingbaseES客户端编程接口指南-JDBC(7. JDBC事务处理)
- 关于#sql#的问题:后面换了一个数据库里面的数据就不能跑了
- inject() can only be used inside setup() or functional components.
- 高等代数_证明_两个矩阵乘积为0,则两个矩阵的秩之和小于等于n
- JNI学习1.环境配置与简单函数实现
- 金仓数据库KingbaseES客户端编程接口指南-JDBC(6. JDBC 大对象数据处理)
- 经典二分法查找的进阶题目——LeetCode33 搜索旋转排序数组
- MySQL group_concat()详解
- unity2D横版游戏教程7-敌人AI死亡效果
- GBase 8c数据库集群中,怎么替换节点呢?比如设置A节点为gtm,换到B节点上。
猜你喜欢
Yolov5 replaces the backbone network of "Megvii Lightweight Convolutional Neural Network ShuffleNetv2"
binder通信实现
inject() can only be used inside setup() or functional components.
MYSQL JDBC图书管理系统
【NOI模拟赛】纸老虎博弈(博弈论SG函数,长链剖分)
leetcode 22.7.31(1)两数之和 (2)整数除法
(三)DDD上下文映射图——老师,我俩可是纯洁的男女关系!
ShuffleNet v2 network structure reproduction (Pytorch version)
从底层看 Redis 的五种数据类型
第一次用postgreSQL,想装主从,用的12.7 tar.gz版本。安装好后没在 share目录下找到样例配置recovery.conf.sample,是安装方式不对,还是路径不对?
随机推荐
25.时间序列预测实战
Recommend several methods that can directly translate PDF English documents
布局管理器
线程安全问题
MYSQL JDBC图书管理系统
新特性解读 | MySQL 8.0 在线调整 REDO
js - the first letter that appears twice
大佬们,mysql里text类型的字段,FlinkCDC需要特殊处理吗 就像处理bigint uns
关于Oracle RAC 11g重建磁盘组的问题
JMeter 常用的几种断言方法,你会几种呢?
金仓数据库 KDTS 迁移工具使用指南 (6. 注意事项)
async - await
Shared_preload_libraries导致很多语法不支持
MySQL BIGINT 数据类型
Typora_Markdown_图片标题(题注)
阿里云的数据库系统怎么升级更新的www.zgysffm.com怎么加快访问速度?
Distributed Computing MapReduce | Spark Experiment
【NOI模拟赛】纸老虎博弈(博弈论SG函数,长链剖分)
千万级别的表分页查询非常慢,怎么办?
『递归』递归概念与典型实例