当前位置:网站首页>数据处理基本流程
数据处理基本流程
2022-06-09 20:13:00 【iT小.新】
处理流程
数据抽取
抽取mysql中的数据到hive仓库ods层
静态分区
动态分区
全量数据
增量数据
数据分区
根据数据抽取的日期分区
根据业务日期进行分区
数据清洗
数据分析
实时数据处理
大数据可视化
抽取流程
创建hive数据表
编写spark程序
创建spark项目
创建一个scala项目 基于maven原形
修改依赖版本号
修改build插件
添加spark依赖
spark-core
spark-sql
mysql-connctor-
创建sparkSession
连接到mysql指定customer表 得到一个DF
把数据抽取到hive二中
1.可以创建临时表
执行HQL进行插入操作
2.直接使用API写入到hive里
连接到hive
spark-submit --master local[] --class 类名 jar包地址
读取mysql数据
执行插入语句 将数据插入到hive表中
边栏推荐
猜你喜欢

The best time to plant a tree is ten years ago, and the second is now (C language selection and cycle training topic)

The version number is approved, but the company has gone bankrupt: can you sell Tencent to make a game now?

Unity将Project升级至URP

Jvm- how the bytecode is executed by the JVM + a little thought about the thread primer

Leetcode 1984. 學生分數的最小差值(可以,已解决)

<collection>和<association>标签

Unity UI scrollbar component

Root file system

做产品规划的技巧心得

UTM转经纬度
随机推荐
压缩文件报错 tar: Exiting with failure status due to previous errors
asp. Net TXT read / write
UNION ALL UNION FULL JOIN
Unity-UI-Slider组件
Unity-UI-Scrollbar组件
Fastjson解析JSON时乱序解决
【opencvsharpDNN】OpenCvSharp中YoloV3和Caffe的实现示例
安路科技发布SF1系列FPSoC新品:高集成低功耗,助力实现多种应用场景
Drive development - Basics
UNION ALL UNION FULL JOIN
asp.net txt读写
ConvNets Principles
UTM转经纬度
这6种实现负载均衡技术的方式不容错过
Official announcement! Broadcom will acquire VMware with us $61billion and assume US $8billion in debt
FPGA入门实验-基于状态机实现多按键控制变速流水灯和跳变灯
根文件系统
Is there any risk in opening an account with Ping An Securities? Is it safe?
2022 gdcpc Guangdong undergraduate program design competition
Root file system