当前位置:网站首页>数据湖(一):数据湖概念
数据湖(一):数据湖概念
2022-08-02 11:45:00 【InfoQ】
数据湖概念
一、什么是数据湖
二、大数据为什么需要数据湖


- Kafka无法支持海量数据存储。对于海量数据量的业务线来说,Kafka一般只能存储非常短时间的数据,比如最近一周,甚至最近一天。
- Kafka无法支持高效的OLAP查询,大多数业务都希望能在DWD\DWS层支持即席查询的,但是Kafka无法非常友好地支持这样的需求。
- 无法复用目前已经非常成熟的基于离线数仓的数据血缘、数据质量管理体系。需要重新实现一套数据血缘、数据质量管理体系。
- Kafka不支持update/upsert,目前Kafka仅支持append。
三、数据湖与数据仓库的区别
- 存储数据类型
- 数据处理模式


边栏推荐
猜你喜欢
![[kali-information collection] (1.8) ARP reconnaissance tool _Netdiscover](/img/04/f477cd8726d147b892f6050d46c312.png)
[kali-information collection] (1.8) ARP reconnaissance tool _Netdiscover

ssm网页访问数据库数据报错

The exchange - string dp

华为eNSP(基础实验通信)

Failed to configure mysql, what's going on?

Crack detection technology based on deep learning

爆款视频怎么做?这里或许有答案!

翁恺C语言程序设计网课笔记合集

STM32+MPU6050 Design Portable Mini Desktop Clock (Automatically Adjust Time Display Direction)

darknet训练yolov4模型
随机推荐
服务器间传输文件
【kali-信息收集】(1.8)ARP侦查工具_Netdiscover
ES2020-23简单易懂又实用的精选特性讲解 日常开发必备干货!
使用kubesphere图形界面创建一个devops的CI/CD流程
ssm web page access database data error
面积曲线AUC(area under curve)
Axure谷歌浏览器扩展程序下载及安装方法(免翻墙)
Failure Analysis | A SELECT statement crashes MySQL, what happened?
基于threejs的商品VR展示平台的设计与实现思路
ssm网页访问数据库数据报错
8大软件供应链攻击事件概述
喜迎八一 《社会企业开展应聘文职人员培训规范》团体标准出版发行会暨橄榄枝大课堂上线发布会在北京举行
雷克萨斯,锁死的安全,挡不住的心寒
Breaking the Boundary, Huawei's Storage Journey
如何通过DBeaver 连接 TDengine?
半夜赶工制作简报的我好想说 : 确定了,最终稿就是这样
匹配滤波(四种滤波器的幅频特性)
记录代码
WPF 实现窗体抖动效果
21 Days Learning Challenge - Day 1 Punch (Screen Density)