当前位置:网站首页>当 TiDB 与 Flink 相结合:高效、易用的实时数仓
当 TiDB 与 Flink 相结合:高效、易用的实时数仓
2020-11-07 20:15:00 【InfoQ】
随着互联网飞速发展,企业业务种类会越来越多,业务数据量会越来越大,当发展到一定规模时,传统的数据存储结构逐渐无法满足企业需求,实时数据仓库就变成了一个必要的基础服务。以维表 Join 为例,数据在业务数据源中以范式表的形式存储,在分析时需要做大量的 Join 操作,降低性能。如果在数据清洗导入过程中就能流式的完成 Join,那么分析时就无需再次 Join,从而提升查询性能。
利用实时数仓,企业可以实现实时 OLAP 分析、实时数据看板、实时业务监控、实时数据接口服务等用途。但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护。而得益于新版 Flink 对 SQL 的支持,以及 TiDB HTAP 的特性,我们探索了一个高效、易用的 Flink+TiDB 实时数仓解决方案。
本文将首先介绍实时数仓的概念,然后介绍 Flink+TiDB 实时数仓的架构与优势,接着给出一些已经在使用中的用户场景,最后给出在 docker-compose 环境下的 Demo,用于读者进行尝试。
实时数仓的概念
数据仓库的概念在 90 年代由 Bill Inmon 提出,是指一个面向主题的、集成的、相对稳定的、反映历史变化的集合,用于支持管理决策。当时的数据仓库通过消息队列收集来自数据源的数据,通过每天或每周进行一次计算以供报表使用,也称为离线数仓。
原文链接:【https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh】。未经作者许可,禁止转载。
版权声明
本文为[InfoQ]所创,转载请带上原文链接,感谢
https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh?utm_source=rss&utm_medium=article
边栏推荐
- 2020-11-06:go中,谈一下调度器。
- 滴滴的分布式ID生成器(Tinyid),好用的一批
- C enumerates the differences between permissions |, and |
- Is blazor ready to serve the enterprise?
- 不要把异常当做业务逻辑,这性能可能你无法承受
- Advanced concurrent programming series 9 (lock interface analysis)
- Business facade and business rule
- Bgfx compilation tutorial
- 如何解决谷歌Chrome浏览器空白页的问题
- C語言重點——指標篇(一文讓你完全搞懂指標)| 從記憶體理解指標 | 指標完全解析
猜你喜欢

vscode 配置

Git SSH bad permissions

Using rabbitmq to implement distributed transaction
![[graffiti footprints of Internet of things] mainstream communication mode of Internet of things](/img/3b/00bc81122d330c9d59909994e61027.jpg)
[graffiti footprints of Internet of things] mainstream communication mode of Internet of things

Exclusive interview with alicloud database of | 2020 PostgreSQL Asia Conference: Wang Xu

7. Swarm builds clusters

What kind of technical ability should a programmer who has worked for 1-3 years? How to improve?

Kubernetes (1): introduction to kubernetes

Using LWA and lync to simulate external test edge free single front end environment

聊聊Go代码覆盖率技术与最佳实践
随机推荐
9.集群之间服务通信 RoutingMesh
使用 Xunit.DependencyInjection 改造测试项目
在pandas中使用pipe()提升代码可读性
Idea activation to 2089 failure
Developing STM32 USB with cubemx
From technology to management, the technology of system optimization is applied to enterprise management
嘉宾介绍|2020 PostgreSQL亚洲大会中文分论坛:潘娟
If you want to forget the WiFi network you used to connect to your Mac, try this!
git 提交规范
k-vim安装及The ycmd server SHUT DOWN (restart with ':YcmRestartServer')这种错误的解决方法
【涂鸦物联网足迹】物联网主流通信方式
Git SSH bad permissions
一种超参数优化技术-Hyperopt
Using thread communication to solve the problem of cache penetrating database avalanche
2018中国云厂商TOP5:阿里云、腾讯云、AWS、电信、联通 ...
And how to solve the conflict between pop-up menu and pop-up menu
confd
chrome浏览器跨域Cookie的SameSite问题导致访问iframe内嵌页面异常
CPU瞒着内存竟干出这种事
谈了多年的数字化转型,为什么还有很多企业依然“口头管理”