当前位置:网站首页># DWD层及DIM层构建## ,220801 ,
# DWD层及DIM层构建## ,220801 ,
2022-08-02 22:29:00 【啊六六六】
orc节省90%空间,,
自己写代码,不要复用代码,ods一套dwd一套,,
简历只描述ods层(orc格式)自动化建表,,,
dwd一般需要数据清洗,,
avro数据类型只要string,bigint,没有注释,,
如果一个项目主题特别多,将主题进行分类
将不同主题划分到不同的主题域
ods_usr_visit_1d
表名:分层_主题域_业务名称_时间粒度
简历写一两个主题,,非常熟悉,,
需求决定
减少join?
rank过滤减少数据量,,,
两种性能一样,,
PPD:谓词下推(hive,SparkSQL支持)
思想:将过滤条件提前
过滤提前,,
sparkSQL从下往上看,stage,hive反着看,,
Hive/Spark:谓词下推 SQL层面优化,
先把不需要数据提前过滤掉,再做Join、分组聚合
尽量手动谓词下推,,容易摸鱼,,
为啥spark看不到库名呀 忘记了 记得提过 兼容性问题,,
后面没有过滤条件,,,
规范:尽量避免同层调用
笛卡尔积
1-显示申明:cross join
2-开启参数:其他join的时候不给关联条件
cross join ==后两表先join,,
SQL只能repartition,,
实际操作,先抽取好表字段,再建表,,,
floor
连上3天 , 2天面试加强,
review,,
今年会把下一年的每一天对应的时间维度的信息放入对应的年分区中(需要文件时,找老师要)
报错明天问老师??
查询没有问题,插入数据表就报这个错误,,
查看hive中数据表,输入密码,还是一直弹出这个窗口,查看不了dwd里面的数据,
,
--派工单状态名称 select dictid,dictname from one_make_dwd.eos_dict_entry where dicttypeid = 'BUSS_WORKORDER_STATUS';
--来电类型名称 select dictid,dictname from one_make_dwd.eos_dict_entry where dicttypeid = 'BUSS_CALL_TYPE';
报错明天问老师??
查询没有问题,插入数据表就报这个错误,,
查看hive中数据表,输入密码,还是一直弹出这个窗口,查看不了dwd里面的数据,
边栏推荐
- Word operation: adjust the English font individually
- 了解 NFT 质押:Web3 中赚取被动收益的另一种方式
- Token、Redis实现单点登录
- qt静态编译出现Project ERROR: Library ‘odbc‘ is not defined
- Towards a General Purpose CNN for Long Range Dependencies in ND
- Shunted Self-Attention via Multi-Scale Token Aggregation
- 00 -- jieba分词
- group of people
- 创建型模式 - 抽象工厂模式AbstractFactory
- vscode 自定义快捷键——设置eslint
猜你喜欢
随机推荐
【C语言】带头双向循环链表(list)详解(定义、增、删、查、改)
一个很少见但很有用的SQL功能
go 序列化与反序列化
How many ways do you know the singleton pattern?
Kubernetes 进阶训练营 网络
No code development platform data ID introductory tutorial
技术分享 | 接口自动化测试中如何对xml 格式做断言验证?
雷克萨斯lm的安全性如何?
Directing a non-relational database introduction and deployment
2022杭电多校第一场(K/L/B/C)
「X」to「Earn」:赛道现状与破局思路
B站回应“HR 称核心用户都是 Loser”:该面试官去年底已被劝退,会吸取教训加强管理
GameStop NFT 市场分析
创建型模式 - 单例模式Singleton
RuoYi-App Startup Tutorial
Token、Redis实现单点登录
Matplotlib drawing core principles explain (more detailed)
vscode 自定义快捷键——设置eslint
mysql 错误:The driver has not received any packets from the server.
Rebound shell principle and implementation