当前位置:网站首页>当 TiDB 与 Flink 相结合:高效、易用的实时数仓
当 TiDB 与 Flink 相结合:高效、易用的实时数仓
2020-11-07 20:15:00 【InfoQ】
随着互联网飞速发展,企业业务种类会越来越多,业务数据量会越来越大,当发展到一定规模时,传统的数据存储结构逐渐无法满足企业需求,实时数据仓库就变成了一个必要的基础服务。以维表 Join 为例,数据在业务数据源中以范式表的形式存储,在分析时需要做大量的 Join 操作,降低性能。如果在数据清洗导入过程中就能流式的完成 Join,那么分析时就无需再次 Join,从而提升查询性能。
利用实时数仓,企业可以实现实时 OLAP 分析、实时数据看板、实时业务监控、实时数据接口服务等用途。但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护。而得益于新版 Flink 对 SQL 的支持,以及 TiDB HTAP 的特性,我们探索了一个高效、易用的 Flink+TiDB 实时数仓解决方案。
本文将首先介绍实时数仓的概念,然后介绍 Flink+TiDB 实时数仓的架构与优势,接着给出一些已经在使用中的用户场景,最后给出在 docker-compose 环境下的 Demo,用于读者进行尝试。
实时数仓的概念
数据仓库的概念在 90 年代由 Bill Inmon 提出,是指一个面向主题的、集成的、相对稳定的、反映历史变化的集合,用于支持管理决策。当时的数据仓库通过消息队列收集来自数据源的数据,通过每天或每周进行一次计算以供报表使用,也称为离线数仓。
原文链接:【https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh】。未经作者许可,禁止转载。
版权声明
本文为[InfoQ]所创,转载请带上原文链接,感谢
https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh?utm_source=rss&utm_medium=article
边栏推荐
- Come on in! Take a few minutes to see how reentrantreadwritelock works!
- Using rabbitmq to implement distributed transaction
- 阿里terway源码分析
- 在pandas中使用pipe()提升代码可读性
- 聊聊Go代码覆盖率技术与最佳实践
- Didi's distributed ID generator (tinyid), easy to use
- The samesite problem of cross domain cookie of Chrome browser results in abnormal access to iframe embedded pages
- 深入web workers (上)
- Web API系列(三)统一异常处理
- 模型预测准确率高达94%!利用机器学习完美解决2000亿美元库存难题
猜你喜欢
git 提交规范
嘉宾专访|2020 PostgreSQL亚洲大会中文分论坛:岳彩波
Awk implements SQL like join operation
.NETCore3.1+ Vue.js Low code workflow engine
DOM节点操作
chrome浏览器跨域Cookie的SameSite问题导致访问iframe内嵌页面异常
Using LWA and lync to simulate external test edge free single front end environment
垃圾分类知识竞赛
vscode 配置
About Devops seven misunderstandings, 99% of people have been hit!
随机推荐
Chinese sub forum of | 2020 PostgreSQL Asia Conference: Pan Juan
[漫谈] 软件设计的目标和途径
聊聊先享後付
廬山真面目之二微服務架構NGINX版本實現
K-vim installation and the ycmd server shut down (restart with ': ycmrestartserver')
谈了多年的数字化转型,为什么还有很多企业依然“口头管理”
Solution to st link USB communication error in stlink Download
HandlerMethodArgumentResolver使用和原理
Mate 40系列发布 搭载华为运动健康服务带来健康数字生活
Knowledge competition of garbage classification
k-vim安装及The ycmd server SHUT DOWN (restart with ':YcmRestartServer')这种错误的解决方法
Come on in! Take a few minutes to see how reentrantreadwritelock works!
awk实现类sql的join操作
Exception calling 'downloadstring' with '1' arguments: 'operation timed out'
11.Service更新
Test the necessary skill points of siege lion! This article takes you to interpret the testing technology under Devops
The JS solution cannot be executed after Ajax loads HTML
Vue: Axios uses this pointer
ajax 载入html后不能执行其中的js解决方法
在pandas中使用pipe()提升代码可读性