当前位置:网站首页>cdh6.x 集成spark-sql
cdh6.x 集成spark-sql
2022-08-04 01:49:00 【涤生大数据】
写在前面
CDH系列默认阉割掉了Spark的spark-sql工具,但是很多公司还是有这个使用的需要,因为线上就有这块的需求,所以结合cdh6.x版本,做了具体的对spark-sql工具支持的集成。
版本说明
| 组件名称 | 组件版本 |
| CDH | CDH 6.2.1 |
| spark | spark-2.4.8 |
第一步:下载原生apache spark
# cd /opt/cloudera/parcels/CDH/lib
# wget http://archive.apache.org/dist/spark/spark-2.4.8/spark-2.4.8-bin-hadoop2.7.tgz
# tar zxvf spark-2.4.8-bin-hadoop2.7.tgz
# ln -s spark2 spark-2.4.8-bin-hadoop2.7
第二步:修改spark配置文件
2.1 配置spark-env.sh
|
2.2 配置spark-defaults.conf
小提示:建议直接cp 现有spark的配置文件,在此基础上修改。
|
Vim /opt/cloudera/parcels/CDH/lib/spark2/conf/spark-defaults.conf
小提示:修改配置文件时,只需要修改文件中标红部分即可,其他可以保持默认。
|
2.3 配置日志级别
# vim /opt/cloudera/parcels/CDH/lib/spark2/conf/log4j.properties
在配置文件中追加以下配置项,其他保持默认
|
第三步:配置依赖包
3.1 上传spark 依赖jar包
|
3.2 配置lzo jar包
|
第四步:配置spark-sql 的全局变量
vim /etc/profile.d/spark.sh
|
#生效
|
第五步:测试使用
全局的任意位置执行 spark-sql指令(注意:执行的linux用户需要有提交任务到yarn的权限)
如果都没有问题,执行show databases ;会看到集群中的所有库。

补充说明:其他客户端如果需要此环境,将上述配置全部scp过去即可。
边栏推荐
猜你喜欢

C程序编译和预定义详解

nodejs+express realizes the access to the database mysql and displays the data on the page

2022 中国算力大会发布“创新先锋”优秀成果
![[store mall project 01] environment preparation and testing](/img/78/415b18a26fdc9e6f59b59ba0a00c4f.png)
[store mall project 01] environment preparation and testing

Example 041: Methods and variables of a class

TensoFlow学习记录(二):基础操作

Continuing to invest in product research and development, Dingdong Maicai wins in supply chain investment

Flutter3.0线程——四步教你如何全方位了解(事件队列)

【store商城项目01】环境准备以及测试

持续投入商品研发,叮咚买菜赢在了供应链投入上
随机推荐
实例041:类的方法与变量
简单排序(暑假每日一题 14)
如何通过API接口从淘宝(或天猫店)复制宝贝到拼多多接口代码对接教程
Flask框架初学-05-命令管理Manager及数据库的使用
FeatureNotFound( bs4.FeatureNotFound: Couldn‘t find a tree builder with the features you requested:
工程制图名词解释-重点知识
splice随机添加和删除的写法
敏捷交付的工程效能治理
Deng Qinglin, Alibaba Cloud Technical Expert: Best Practices for Disaster Recovery across Availability Zones and Multiple Lives in Different Locations on the Cloud
Example 040: Reverse List
2022年上半年各大厂Android面试题整理及答案解析(持续更新中......)
Intranet penetration - application
The browser
lombok注解@RequiredArgsConstructor的使用
idea中diagram使用
什么是SVN(Subversion)?
实例038:矩阵对角线之和
Analysis of usage scenarios of mutex, read-write lock, spin lock, and atomic operation instructions xaddl and cmpxchg
sql有关问题,小时粒度,找到前一个小时内的数据
Flutter3.0线程——四步教你如何全方位了解(事件队列)