当前位置:网站首页>来自数砖大佬的 130页 PPT 深入介绍 Apache Spark 3.2 & 3.3 新功能
来自数砖大佬的 130页 PPT 深入介绍 Apache Spark 3.2 & 3.3 新功能
2022-07-02 22:45:00 【过往记忆】
本文 PPT 材料来自 DATA + AI SUMMIT 2022 6月29日标题为《Data Deep Dive into the New Features of Apache Spark 3.2 and 3.3》分享的全文 PPT,大约130页,分享者来自数砖的 Daniel Tenedorio、范文臣以及李潇等大佬。关于本文对应的视频将在后期上传,敬请关注过往记忆大数据微信公众号。
Apache Spark 已经成为在单节点或集群上执行数据工程、数据科学和机器学习的最广泛使用的计算引擎。Spark 的月 maven下载数量迅速增长到2000万次。本 PPT 将讨论 Spark 3.2 和 3.3 中的高级特性和改进。并深入介绍以下功能:
在 Apache Spark 上引入 pandas API 以统一不同数据规模的 API;
完成 ANSI SQL 兼容模式,简化 SQL 工作负载的迁移;
可以在生产环境下使用自适应查询执行以在运行时加速 Spark SQL;
引入 RocksDB 状态存储,使状态处理更具可扩展性。
关于本文的 PPT 材料请添加 fangzhen0219 微信获取。
































































































































边栏推荐
- Returns the size of the largest binary search subtree in a binary tree
- 公司里只有一个测试是什么体验?听听他们怎么说吧
- [analysis of STL source code] imitation function (to be supplemented)
- 富滇银行完成数字化升级|OceanBase数据库助力布局分布式架构中台
- [array] binary search
- [proteus simulation] 51 MCU +lcd12864 push box game
- Mapper agent development
- 35 pages dangerous chemicals safety management platform solution 2022 Edition
- [error record] the flutter reports an error (could not resolve io.flutter:flutter_embedding_debug:1.0.0.)
- Analyze ad654: Marketing Analytics
猜你喜欢

基于Pyqt5工具栏按钮可实现界面切换-1

JSON data transfer parameters

YOLOX加强特征提取网络Panet分析

Writing of head and bottom components of non routing components

How much do you know about synchronized?

Many to one, one to many processing

RuntimeError: no valid convolution algorithms available in CuDNN

Create an interactive experience of popular games, and learn about the real-time voice of paileyun unity

開源了 | 文心大模型ERNIE-Tiny輕量化技術,又准又快,效果全開

MySQL Foundation
随机推荐
Use of cocospods
In February 2022, the ranking list of domestic databases: oceanbase regained its popularity with "three consecutive increases", and gaussdb is expected to achieve the largest increase this month
Go basic data type
采用VNC Viewer方式遠程連接樹莓派
leetcode 650. 2 Keys Keyboard 只有两个键的键盘(中等)
Three solutions to frequent sticking and no response of explorer in win11 system
RuntimeError: no valid convolution algorithms available in CuDNN
Many to one, one to many processing
PHP get real IP
Connexion à distance de la tarte aux framboises en mode visionneur VNC
流媒体技术优化
直击产业落地!飞桨重磅推出业界首个模型选型工具
基于OpenCV实现口罩识别
67 page overall planning and construction plan for a new smart city (download attached)
php 获取真实ip
Convolution和Batch normalization的融合
Request and response
C# MVC创建一个视图摆脱布局的影响
The privatization deployment of SaaS services is the most efficient | cloud efficiency engineer points north
一文掌握基于深度学习的人脸表情识别开发(基于PaddlePaddle)