当前位置:网站首页>《Greenplum构建实时数据仓库实践》简介
《Greenplum构建实时数据仓库实践》简介
2022-08-04 00:51:00 【新知图书】
#好书推荐##好书奇遇季#《Greenplum构建实时数据仓库实践》,京东当当天猫都有发售。定价89元,网店打折销售其实没多少钱。
Greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此Greenplum成为一款理想的分析型数据库产品。本书详解Greenplum数据仓库构建与数据分析技术,配套示例源码。
本书内容
本书共分10章。内容包括数据仓库简介、数据仓库设计基础、Greenplum与数据仓库、Greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、Greenplum运维与监控、集成机器学习库MADlib。
本书涉及的具体技术
(1)MySQL主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。
(2)Canal Server实时获取增量MySQL binlog,并将其传入Kafka消息队列。
(3)Kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。
(4)Canal ClientAdapter负责消费Kafka中的消息,将数据流传输到Greenplum。
(5)Greenplum提供实时ETL功能,自动维护操作数据存储、维度表与事实表。
(6)Greenplum数据库权限与角色管理、数据导入导出、性能优化、监控与维护。
(7)Greenplum集成机器学习库MADlib,对数据进行分析与挖掘。
本书读者
本书适合Greenplum初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。
本书作者
王雪迎,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。著有图书《Greenplum构建实时数据仓库实践》《Kettle构建Hadoop ETL系统实践》《Hadoop构建数据仓库实践》《HAWQ数据仓库与数据挖掘实战》《SQL机器学习库MADlib技术解析》《MySQL高可用实践》。

边栏推荐
- The Beijing E-sports Metaverse Forum was successfully held
- 【性能优化】MySQL性能优化之存储引擎调优
- jmeter分布式压测
- typescript52-简化泛型函数调用
- LeetCode third topic (the Longest Substring Without Repeating Characters) trilogy # 3: two optimization
- 手撕Nacos源码,今日撕服务端源码
- 教你如何定位不合理的SQL?并优化之
- typescript51 - basic use of generics
- GeoAO:一种快速的环境光遮蔽方案
- XSS - Bypass for loop filtering
猜你喜欢
随机推荐
Install third-party packages via whl
typescript54 - generic constraints
c语言分层理解(c语言操作符)
分布式事务框架 seata
Tanabata festival coming, VR panoramic look god assists for you
第1章:初识数据库与MySQL----MySQL安装
易动纷享--测试实习生视频面试
XSS - Bypass for loop filtering
米哈游--测试开发提前批
小米--测试开发
win10+cuda11.7+pytorch1.12.0 installation
建木DevOps流程的快速运用
Mvc、Mvp和Mvvm
R3LIVE论文学习(二):VIO子系统
轻量级网络整理及其在Yolov5上的实现
jmeter distributed stress test
typescript57-数组泛型接口
Vant3—— 点击对应的name名称跳转到下一页对应的tab栏的name的位置
教你如何定位不合理的SQL?并优化之
Apache DolphinScheduler新一代分布式工作流任务调度平台实战-中









