当前位置:网站首页>详谈数据同步工具ETL、ELT,反向ETL
详谈数据同步工具ETL、ELT,反向ETL
2022-07-24 05:19:00 【Nexadata】
详谈数据同步工具ETL、ELT,反向ETL
什么是数据同步工具?
数据同步工具的作用是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。数据同步是大数据项目重要的一个环节。
关于ETL、ELT与反向ETL
何为ETL?
将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
ETL的理念着重体现在一些数据清洗转化功能,比如空值处理、规范化数据、数据替换、数据验证等等。
何为ELT?
将数据从来源端经过抽取(extract)、加载(load)、转换(transform)至目的端的过程。
在数据湖或数据中台则往往会采用ELT的方式进行数据同步。
ELT首先把数据用一种高效的方式从数据源抽取出来,然后在数据仓库中进行数据的转换处理。这种ELT的方式相比于ETL有很大的优势,从ETL到ELT的改变主要得益于云的普及,让存储成本下降,从而使得传统ETL这种将数据处理分段,只存储重要结果性数据的方式得以被改变。同时国内也出现了创新的技术路线:采用ELT+A(Active)的模式,来提升企业利用数据价值的效率 。
何为反向ETL?
反向ETL是一种提取已清理的和处理过的数据架构。它会将数据从数据仓库(或数据湖/集市)复制到一个或多个操作系统。数据可以被重新引入诸如Salesforce等其他应用程序,可用于业务运营和预测。通过操作已提取的数据源,各类用户可以使用常用的工具来访问数据,并获取相关的洞见。作为现代化数据技术栈的组件,反向ETL允许企业开展那些比单独使用商业智能(BI)工具,更为复杂的分析。
作为一种战略性全新的集成流程,反向ETL可以减少那些快速发展型企业在数据分析上花费的时间。该流程更专注于将数据与业务用户的操作工具相同步,以激活数据仓库中的数据。用户必须事先定义好数据,并将其映射到最终目的地的适当列/字段上。
同时,由于企业的数据存储(如,数据参考或关系数据库)已成为一种并非所有人都可以完全访问到的存储库,因此,我们需要通过反向ETL,来为不同的业务角色提供基本的数据。
边栏推荐
- php+mysql导出excel文件方法
- Flink函数(1):rich function
- 达梦数据库_逻辑架构基础
- Node connects to MySQL and uses Navicat for visualization
- Define attribute of UMI
- 通用分页2.0
- Flink 时间流处理
- Function analysis of GeoServer rest API
- Flink watermark mechanism
- The profound meaning of unlimited ecological development in Poka -- Multidimensional Interpretation of parallel chain
猜你喜欢
随机推荐
Open Web3, once unpopular decentralized identity (did)
haclabs: no_name(HL.ova)靶机渗透-Vulnhub
XML之建模
盘点波卡生态潜力项目 | 跨链特性促进多赛道繁荣
【vsphere高可用】主机故障切换
【activiti】组任务
Hex to RGB
Logic development analysis of LP dual currency liquidity pledge mining system
MySQL 批量插入demo
CESS 测试网上线!首个提供多元应用场景的去中心化存储网络
去中心化的底层是共识——Polkadot 混合共识机制解读
Fusdt流动性质押挖矿开发逻辑系统原理
PyCharm设置代码模板
【mycat】mycat分库分表
Flink Format系列(1)-JSON
【mycat】mycat相关概念
【vsphere高可用】虚拟机的重置和重启
Whole station downloader recommendation
LP双币流动性质押挖矿系统逻辑开发分析
Polkadot | 一文解读颠覆传统社媒的Liberty计划如何在波卡落地









