当前位置:网站首页>《Greenplum构建实时数据仓库实践》简介
《Greenplum构建实时数据仓库实践》简介
2022-08-04 00:51:00 【新知图书】
#好书推荐##好书奇遇季#《Greenplum构建实时数据仓库实践》,京东当当天猫都有发售。定价89元,网店打折销售其实没多少钱。
Greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此Greenplum成为一款理想的分析型数据库产品。本书详解Greenplum数据仓库构建与数据分析技术,配套示例源码。
本书内容
本书共分10章。内容包括数据仓库简介、数据仓库设计基础、Greenplum与数据仓库、Greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、Greenplum运维与监控、集成机器学习库MADlib。
本书涉及的具体技术
(1)MySQL主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。
(2)Canal Server实时获取增量MySQL binlog,并将其传入Kafka消息队列。
(3)Kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。
(4)Canal ClientAdapter负责消费Kafka中的消息,将数据流传输到Greenplum。
(5)Greenplum提供实时ETL功能,自动维护操作数据存储、维度表与事实表。
(6)Greenplum数据库权限与角色管理、数据导入导出、性能优化、监控与维护。
(7)Greenplum集成机器学习库MADlib,对数据进行分析与挖掘。
本书读者
本书适合Greenplum初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。
本书作者
王雪迎,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。著有图书《Greenplum构建实时数据仓库实践》《Kettle构建Hadoop ETL系统实践》《Hadoop构建数据仓库实践》《HAWQ数据仓库与数据挖掘实战》《SQL机器学习库MADlib技术解析》《MySQL高可用实践》。
边栏推荐
- 教你如何定位不合理的SQL?并优化之
- "Miscellaneous" barcode by Excel as a string
- Vant3 - click on the corresponding name name to jump to the next page corresponding to the location of the name of the TAB bar
- 跨域问题解决方式 代理服务器
- boot issue
- jmeter distributed stress test
- Web3 安全风险令人生畏?应该如何应对?
- 求解同余方程 数论 扩展欧几里得
- 虚拟机CentOS7中无图形界面安装Oracle
- GeoAO:一种快速的环境光遮蔽方案
猜你喜欢
【性能优化】MySQL常用慢查询分析工具
面试必问的HashCode技术内幕
Demand analysis of MES management system in electronic assembly industry
JVM垃圾回收总结(未完待续)
LeetCode third topic (the Longest Substring Without Repeating Characters) trilogy # 3: two optimization
MATLAB三维绘图命令plot3入门
Using matlab to solve the linear optimization problem based on matlab dynamic model of learning notes _11 】 【
BioVendor人Clara细胞蛋白(CC16)Elisa试剂盒检测步骤
字符串的排列
Read FastDFS in one article
随机推荐
跨域问题解决方式 代理服务器
LeetCode 19:删除链表的倒数第 N 个结点
SQL优化的一些建议,希望可以帮到和我一样被SQL折磨的你
MPLS Comprehensive Experiment
电子制造企业部署WMS仓储管理系统的好处是什么
It will invest about 200 billion US dollars in the United States in 20 years, and Samsung Electronics looks so handsome
ES6高级-迭代器与生成器的用法
【虚拟化生态平台】虚拟化平台搭建
Google Earth Engine ——利用公开的河流数据计算河流的有效宽度
Demand analysis of MES management system in electronic assembly industry
【虚拟化生态平台】虚拟化平台esxi挂载USB硬盘
Node.js的基本使用(三)数据库与身份认证
【详细教程】一文参透MongoDB聚合查询
分子个数 数论(欧拉函数 前缀和
高斯推断推导
Web3 security risks daunting?How should we respond?
After building the pytorch environment, the pip and conda commands cannot be used
【虚拟户生态平台】虚拟化平台安装时遇到的坑
The problem of disorganized data output by mnn model
电子组装行业对MES管理系统的需求分析