当前位置:网站首页>cdh6.x 集成spark-sql
cdh6.x 集成spark-sql
2022-08-04 01:49:00 【涤生大数据】
写在前面
CDH系列默认阉割掉了Spark的spark-sql工具,但是很多公司还是有这个使用的需要,因为线上就有这块的需求,所以结合cdh6.x版本,做了具体的对spark-sql工具支持的集成。
版本说明
| 组件名称 | 组件版本 |
| CDH | CDH 6.2.1 |
| spark | spark-2.4.8 |
第一步:下载原生apache spark
# cd /opt/cloudera/parcels/CDH/lib
# wget http://archive.apache.org/dist/spark/spark-2.4.8/spark-2.4.8-bin-hadoop2.7.tgz
# tar zxvf spark-2.4.8-bin-hadoop2.7.tgz
# ln -s spark2 spark-2.4.8-bin-hadoop2.7
第二步:修改spark配置文件
2.1 配置spark-env.sh
|
2.2 配置spark-defaults.conf
小提示:建议直接cp 现有spark的配置文件,在此基础上修改。
|
Vim /opt/cloudera/parcels/CDH/lib/spark2/conf/spark-defaults.conf
小提示:修改配置文件时,只需要修改文件中标红部分即可,其他可以保持默认。
|
2.3 配置日志级别
# vim /opt/cloudera/parcels/CDH/lib/spark2/conf/log4j.properties
在配置文件中追加以下配置项,其他保持默认
|
第三步:配置依赖包
3.1 上传spark 依赖jar包
|
3.2 配置lzo jar包
|
第四步:配置spark-sql 的全局变量
vim /etc/profile.d/spark.sh
|
#生效
|
第五步:测试使用
全局的任意位置执行 spark-sql指令(注意:执行的linux用户需要有提交任务到yarn的权限)
如果都没有问题,执行show databases ;会看到集群中的所有库。

补充说明:其他客户端如果需要此环境,将上述配置全部scp过去即可。
边栏推荐
- (cf)Codeforces Round #811 (Div. 3)A--E详细题解
- GNSS文章汇总
- 2022年上半年各大厂Android面试题整理及答案解析(持续更新中......)
- 5.scrapy中间件&分布式爬虫
- Slipper —— 虚点,最短路
- Multithreading JUC Learning Chapter 1 Steps to Create Multithreading
- html select tag assignment database query result
- Kubernetes:(九)coredns(浪不动了)
- lombok注解@RequiredArgsConstructor的使用
- SAP SD module foreground operation
猜你喜欢
随机推荐
在Activity中获取另一个XML文件的控件
Example 041: Methods and variables of a class
Small Turtle Compilation Notes
KunlunBase 1.0 发布了!
Use nodejs switch version (no need to uninstall and reinstall)
JS 从零教你手写节流throttle
Please refer to dump files (if any exist) [date].dump, [date]-jvmRun[N].dump and [date].dumpstream.
2022 中国算力大会发布“创新先锋”优秀成果
有没有jdbc 链接优炫数据库文档及示例?
SAP SD模块前台操作
优秀的测试/开发程序员,是怎样修炼的?步步为营地去执行......
nodejs 安装多版本 版本切换
特征值与特征向量
flask框架初学-06-对数据库的增删改查
DDTL: Domain Transfer Learning at a Distance
Android interview questions and answer analysis of major factories in the first half of 2022 (continuously updated...)
Continuing to invest in product research and development, Dingdong Maicai wins in supply chain investment
appium软件自动化测试框架
v-model
GraphQL背后处理及执行过程是什么









