当前位置:网站首页>《Greenplum构建实时数据仓库实践》简介
《Greenplum构建实时数据仓库实践》简介
2022-08-04 00:51:00 【新知图书】
#好书推荐##好书奇遇季#《Greenplum构建实时数据仓库实践》,京东当当天猫都有发售。定价89元,网店打折销售其实没多少钱。
Greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此Greenplum成为一款理想的分析型数据库产品。本书详解Greenplum数据仓库构建与数据分析技术,配套示例源码。
本书内容
本书共分10章。内容包括数据仓库简介、数据仓库设计基础、Greenplum与数据仓库、Greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、Greenplum运维与监控、集成机器学习库MADlib。
本书涉及的具体技术
(1)MySQL主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。
(2)Canal Server实时获取增量MySQL binlog,并将其传入Kafka消息队列。
(3)Kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。
(4)Canal ClientAdapter负责消费Kafka中的消息,将数据流传输到Greenplum。
(5)Greenplum提供实时ETL功能,自动维护操作数据存储、维度表与事实表。
(6)Greenplum数据库权限与角色管理、数据导入导出、性能优化、监控与维护。
(7)Greenplum集成机器学习库MADlib,对数据进行分析与挖掘。
本书读者
本书适合Greenplum初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。
本书作者
王雪迎,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。著有图书《Greenplum构建实时数据仓库实践》《Kettle构建Hadoop ETL系统实践》《Hadoop构建数据仓库实践》《HAWQ数据仓库与数据挖掘实战》《SQL机器学习库MADlib技术解析》《MySQL高可用实践》。

边栏推荐
- LeetCode第三题(Longest Substring Without Repeating Characters)三部曲之三:两次优化
- Spinnaker调用Jenkins API 返回403错误
- XSS-绕过for循环过滤
- typescript51-泛型的基本使用
- LeetCode third topic (the Longest Substring Without Repeating Characters) trilogy # 3: two optimization
- [Miscellaneous] How to install the specified font into the computer and then use the font in the Office software?
- 字符串变形
- MPLS Comprehensive Experiment
- C 学生管理系统_分析
- Using matlab to solve the linear optimization problem based on matlab dynamic model of learning notes _11 】 【
猜你喜欢

Eight things to pay attention to in spot silver

How to find the cause of Fiori Launchpad routing errors by single-step debugging

js中常用的几种遍历处理数据的方法梳理

Getting started with MATLAB 3D drawing command plot3

600MHz频段来了,它会是新的黄金频段吗?

ENS域名注册量创历史新高 逆市增长之势?光环之下存在炒作风险

动态内存二

typescript51 - basic use of generics

What warehouse management problems can WMS warehouse management system solve in the electronics industry?

通过whl安装第三方包
随机推荐
如何通过单步调试的方式找到引起 Fiori Launchpad 路由错误的原因试读版
Spinnaker调用Jenkins API 返回403错误
七夕佳节即将来到,VR全景云游为你神助攻
C语言 函数递归
win10+cuda11.7+pytorch1.12.0 installation
Modulo operation (MOD)
typescript48 - type compatibility between functions
Justin Sun: Web3.0 and the Metaverse will assist mankind to enter the online world more comprehensively
机器学习——库
GeoAO:一种快速的环境光遮蔽方案
c语言分层理解(c语言指针(上))
一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)
SQL优化的一些建议,希望可以帮到和我一样被SQL折磨的你
电子制造企业部署WMS仓储管理系统的好处是什么
动态内存二
LYVE1抗体丨Relia Tech LYVE1抗体解决方案
boot issue
卡尔曼滤波器KF
What warehouse management problems can WMS warehouse management system solve in the electronics industry?
Jmeter cross-platform operation CSV files