当前位置:网站首页>spark on yarn
spark on yarn
2022-08-02 14:05:00 【boyzwz】
提交代码到yarn模式运行
准备代码:
package com.shujia.spark.core
import com.shujia.spark.util.HdfsUtil
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object HomeWork2 {
def main(args: Array[String]): Unit = {
/**
* 创建spark环境
*/
val conf = new SparkConf()
conf.setAppName("HomeWork2")
/**
* 提交代码到yarn模式运行,需将local本地模式注释
*/
// conf.setMaster("local")
val sc = new SparkContext(conf)
/**
* 2、统计总分大于年级平均分的学生
*/
//读取hdfs上的文件
val linesRDD: RDD[String] = sc.textFile("/spark_data/score.txt")
//获取学生id和分数
val scoreRDD: RDD[(String, Int)] = linesRDD
//切分
.map(lines => lines.split(","))
//过滤脏数据
.filter(arr => arr.length == 3)
//取数据
.map(arr => (arr(0), arr(2).toInt))
//求出每个学生总分
val sumRDD: RDD[(String, Int)] = scoreRDD.reduceByKey((x, y) => x + y)
//求出年级平均分
val scores: RDD[Int] = sumRDD.map(kv => kv._2)
val avg_score: Double = scores.sum() / scores.count()
//过滤出高于平均分的学生
val bigRDD: RDD[(String, Int)] = sumRDD.filter(kv => kv._2 > avg_score)
//处理数据
val resultRDD: RDD[String] = bigRDD.map(kv => s"${kv._1}\t${kv._2}")
//删除路径;自定义封装类,若hdfs上路径已存在,则删除路径
HdfsUtil.delete("/spark_data/big_avg")
//保存数据到hdfs上
resultRDD.saveAsTextFile("/spark_data/big_avg")
}
}
将代码打成jar包上传至服务器
(启动Hadoop)
spark-submit --master yarn-client --class com.shujia.spark.core.HomeWork2 spark-1.0.jar


spark架构

spark on yarn client模式与cluster模式的区别
cluster模式不会在本地打印日志
获取yarn程序执行日志 执行成功之后才能获取到
yarn logs -applicationId application_1560967444524_0003
边栏推荐
猜你喜欢
随机推荐
原码、反码、补码和移码
[ROS] (05) ROS Communication - Node, Nodes & Master
VS Code远程开发及免密配置
Flask framework
科创知识年度盛会,中国科创者大会8月6日首场开幕!
Visual Studio配置OpenCV之后,提示:#include<opencv2/opencv.hpp>无法打开源文件
什么是闭包?闭包的作用?闭包的应用?有什么缺点?
Spark_Core
鼠标右键菜单栏太长如何减少
Paddle window10 environment using conda installation
St. Regis Takeaway Notes - Lecture 05 Getting Started with Redis
华为防火墙IPS
Introduction and use of Haystack
C语言初级—常见问题(100~200素数,计算1+11+111+...,从键盘获取一个数并输出有几个位)
Flask-SQLAlchemy
C语言初级—从键盘接收一个整形并逆序输出
Hession使用
c语言三子棋详解!!! (电脑智能下棋)(附上完整代码)
verilog学习|《Verilog数字系统设计教程》夏宇闻 第三版思考题答案(第十一章)
MarkDown syntax summary











