当前位置:网站首页>《Greenplum构建实时数据仓库实践》简介
《Greenplum构建实时数据仓库实践》简介
2022-08-04 00:51:00 【新知图书】
#好书推荐##好书奇遇季#《Greenplum构建实时数据仓库实践》,京东当当天猫都有发售。定价89元,网店打折销售其实没多少钱。
Greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此Greenplum成为一款理想的分析型数据库产品。本书详解Greenplum数据仓库构建与数据分析技术,配套示例源码。
本书内容
本书共分10章。内容包括数据仓库简介、数据仓库设计基础、Greenplum与数据仓库、Greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、Greenplum运维与监控、集成机器学习库MADlib。
本书涉及的具体技术
(1)MySQL主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。
(2)Canal Server实时获取增量MySQL binlog,并将其传入Kafka消息队列。
(3)Kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。
(4)Canal ClientAdapter负责消费Kafka中的消息,将数据流传输到Greenplum。
(5)Greenplum提供实时ETL功能,自动维护操作数据存储、维度表与事实表。
(6)Greenplum数据库权限与角色管理、数据导入导出、性能优化、监控与维护。
(7)Greenplum集成机器学习库MADlib,对数据进行分析与挖掘。
本书读者
本书适合Greenplum初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。
本书作者
王雪迎,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。著有图书《Greenplum构建实时数据仓库实践》《Kettle构建Hadoop ETL系统实践》《Hadoop构建数据仓库实践》《HAWQ数据仓库与数据挖掘实战》《SQL机器学习库MADlib技术解析》《MySQL高可用实践》。
边栏推荐
- XSS - Bypass for loop filtering
- LeetCode第三题(Longest Substring Without Repeating Characters)三部曲之三:两次优化
- 因为一次bug的教训,我决定手撕Nacos源码(先撕客户端源码)
- XSS-绕过for循环过滤
- 带你造轮子,自定义一个随意拖拽可吸边的悬浮View组件
- typescript51-泛型的基本使用
- 【超详细教程】LVS+KeepAlived高可用部署实战应用
- Google Earth Engine - Calculates the effective width of rivers using publicly available river data
- C # WPF equipment monitoring software (classic) - the next
- typescript48 - type compatibility between functions
猜你喜欢
LeetCode third topic (the Longest Substring Without Repeating Characters) trilogy # 3: two optimization
字符串的排列
typescript57 - Array generic interface
2022-08-03: What does the following go code output?A: 2; B: 3; C: 1; D: 0.package main import "fmt" func main() { slice := []i
typescript55 - generic constraints
Analysis: What makes the Nomad Bridge hack unique
【超详细教程】LVS+KeepAlived高可用部署实战应用
typescript54 - generic constraints
R3LIVE论文学习(二):VIO子系统
"Miscellaneous" barcode by Excel as a string
随机推荐
字符串的排列
【虚拟化生态平台】虚拟化平台esxi挂载USB硬盘
View the version number of CUDA, pytorch, etc.
小米--测试开发
电子制造企业部署WMS仓储管理系统的好处是什么
Analysis: What makes the Nomad Bridge hack unique
Eight things to pay attention to in spot silver
2023年第六届亚太应用数学与统计学国际会议(AMS 2023)
米哈游--测试开发提前批
Read FastDFS in one article
一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)
The problem of disorganized data output by mnn model
求解同余方程 数论 扩展欧几里得
Mvc, Mvp and Mvvm
WMS仓储管理系统能解决电子行业哪些仓库管理问题
全面讲解 Handler机制原理解析 (小白必看)
Modulo operation (MOD)
分子个数 数论(欧拉函数 前缀和
ping数据包中的进程号
机器学习——库