当前位置:网站首页>spark on yarn
spark on yarn
2022-08-02 14:05:00 【boyzwz】
提交代码到yarn模式运行
准备代码:
package com.shujia.spark.core
import com.shujia.spark.util.HdfsUtil
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object HomeWork2 {
def main(args: Array[String]): Unit = {
/**
* 创建spark环境
*/
val conf = new SparkConf()
conf.setAppName("HomeWork2")
/**
* 提交代码到yarn模式运行,需将local本地模式注释
*/
// conf.setMaster("local")
val sc = new SparkContext(conf)
/**
* 2、统计总分大于年级平均分的学生
*/
//读取hdfs上的文件
val linesRDD: RDD[String] = sc.textFile("/spark_data/score.txt")
//获取学生id和分数
val scoreRDD: RDD[(String, Int)] = linesRDD
//切分
.map(lines => lines.split(","))
//过滤脏数据
.filter(arr => arr.length == 3)
//取数据
.map(arr => (arr(0), arr(2).toInt))
//求出每个学生总分
val sumRDD: RDD[(String, Int)] = scoreRDD.reduceByKey((x, y) => x + y)
//求出年级平均分
val scores: RDD[Int] = sumRDD.map(kv => kv._2)
val avg_score: Double = scores.sum() / scores.count()
//过滤出高于平均分的学生
val bigRDD: RDD[(String, Int)] = sumRDD.filter(kv => kv._2 > avg_score)
//处理数据
val resultRDD: RDD[String] = bigRDD.map(kv => s"${kv._1}\t${kv._2}")
//删除路径;自定义封装类,若hdfs上路径已存在,则删除路径
HdfsUtil.delete("/spark_data/big_avg")
//保存数据到hdfs上
resultRDD.saveAsTextFile("/spark_data/big_avg")
}
}
将代码打成jar包上传至服务器
(启动Hadoop)
spark-submit --master yarn-client --class com.shujia.spark.core.HomeWork2 spark-1.0.jar
spark架构
spark on yarn client模式与cluster模式的区别
cluster模式不会在本地打印日志
获取yarn程序执行日志 执行成功之后才能获取到
yarn logs -applicationId application_1560967444524_0003
边栏推荐
猜你喜欢
MySQL知识总结 (十) 一条 SQL 的执行过程详解
c语言三子棋详解!!! (电脑智能下棋)(附上完整代码)
Using the cloud GPU + pycharm training model to realize automatic background run programs, save training results, the server automatically power off
MySQL知识总结 (三) 索引
猜数字游戏,猜错10次关机(srand、rand、time)随机数生成三板斧(详细讲解!不懂问我!)
[VCU] Detailed S19 file (S-record)
STM32 (F407) - stack
C语言日记 5、7setprecision()问题
主存储器(一)
原码、补码、反码
随机推荐
标签加id 和 加号 两个文本框 和一个var 赋值
数据的表示方法和转换(二进制、八进制、十进制、十六进制)
uni-app页面、组件视图数据无法刷新问题的解决办法
C语言sizeof和strlen的区别
Redis-01-Nosql概述
Ehcache基础学习
drf source code analysis and global catch exception
verilog学习|《Verilog数字系统设计教程》夏宇闻 第三版思考题答案(第九章)
MySQL知识总结 (十一) MySql 日志,数据备份,数据恢复
安装使用——百家CMS微商城说明文档(2)
数据乱码问题—更改mysql字符编码
ThinkPHP5.0内置分页函数Paginate无法获取POST页数问题的解决办法
ToF相机从Camera2 API中获取DEPTH16格式深度图
C语言初级—用一角,两角,五角和一元组成3.5元有多少种组合方法
我理解的学习金字塔
spark(standalone,yarn)
Programming Specifications - LiteOS
liunx下mysql遇到的简单问题
Building and getting started with the Flask framework
binlog与iptables防nmap扫描