当前位置:网站首页>一篇文章搞懂数据仓库:元数据分类、元数据管理
一篇文章搞懂数据仓库:元数据分类、元数据管理
2022-07-28 06:33:00 【51CTO】
目录
1、业务元数据
2、技术元数据
3、管理元数据
4、小编有话
1、业务元数据
- 描述 ”数据”背后的业务含义
- 主题定义:每段 ETL、表背后的归属业务主题。
- 业务描述:每段代码实现的具体业务逻辑。
- 标准指标:类似于 BI 中的语义层、数仓中的一致性事实;将分析中的指标进行规范化。
- 标准维度:同标准指标,对分析的各维度定义实现规范化、标准化。
- 不断的进行维护且与业务方进行沟通确认。
2、技术元数据
- 数据源元数据
- 例如:数据源的 IP、端口、数据库类型;数据获取的方式;数据存储的结构;原数据各列的定义及 key 指对应的值。
- ETL 元数据
- 根据 ETL 目的的不同,可以分为两类:数据清洗元数据;数据处理元数据。
- 数据清洗,主要目的是为了解决掉脏数据及规范数据格式;因此此处元数据主要为:各表各列的"正确"数据规则;默认数据类型的"正确"规则。
- 数据处理,例如常见的表输入表输出;非结构化数据结构化;特殊字段的拆分等。源数据到数仓、数据集市层的各类规则。比如内容、清理、数据刷新规则。
- 数据仓库元数据
- 数据仓库结构的描述,包括仓库模式、视图、维、层次结构及数据集市的位置和内容;业务系统、数据仓库和数据集市的体系结构和模式等。
- BI 元数据
- 汇总用的算法、包括各类度量和维度定义算法。数据粒度、主题领域、聚集、汇总、预定义的查询与报告。
3、管理元数据
管理领域相关,包括管理流程、人员组织、角色职责等。
4、小编有话
在日常工作中,元数据的管理主要体现在元数据的采集、存储、查询、应用几个方面。原则上应从规范化,到脚本化,到工具化的方向进行建设。
- 采集:元数据采集时尽可能详细,真实,可通过工具生成或者勾选,避免手动录入带来不规范等问题
- 存储:存储元数据要做到不失真,元数据变更时及时同步
- 查询:通过网页或库表等方式,方便快捷的看到元数据,辅助进行开发
- 应用:数据血缘、优化调度依赖、数据治理等
边栏推荐
- Basic dictionary of deep learning --- activation function, batch size, normalization
- In the task manager, the CPU speed displayed is greater than its maximum speed [main frequency]
- 数字签名和CA证书
- Mysql, how many columns can be used to create an index?
- PMP practice once a day | don't get lost in the exam -7.13
- Openstack dashboard configuring public network access
- Es6: template string
- SQL function
- Draw.io image saving path settings
- A group of South University students rely on science and technology to go to sea, with an annual income of 1billion
猜你喜欢

Prescan quick start to proficient in lecture 17, speed curve editor

二维数组及操作

c语言中函数的介绍(血书20000字!!!!)

网口网络水晶头RJ45、POE接口定义线序

Record a MYCAT connection and solve the problems of communications link failure

Allure use

Change the dataDir path after mysql8.0.16 installation

Qt使用信号量控制线程(QSemaphore)

Oracle local network service

Information system project manager must recite the core examination site (41) risk management plan
随机推荐
Technology sharing | common proxy tools for interface testing
[300 + selected interview questions from big companies continued to share] big data operation and maintenance sharp knife interview question column (VIII)
sparksql 与flinksql 建表 与 连表记录
[Qt5] small software with 5 people randomly selected from the bid evaluation expert base
JS candy xiaoxiaole game source code
Unity中队列(Queue)的简单使用
Es6: template string
Fxksmdb.exe process description
[reprint] man Rsync translation (Chinese Manual of Rsync command)
GD32使用ST的HAL库和GD官方库的一些体会
MCU IO port controls 12V voltage on and off, MOS and triode circuit
Recommend a fully open source, feature rich, beautiful interface mall system
Oracle local network service
Parse tree structure JS
Tensorflow uses deep learning (II)
js信息提示框定时关闭
Can a flinksql script write insert statements for two tables?
jquey的基础语法
Plantuml Usage Summary
【花书笔记】 之 Chapter01 引言