当前位置:网站首页>数据湖(一):数据湖概念
数据湖(一):数据湖概念
2022-08-02 11:45:00 【InfoQ】
数据湖概念
一、什么是数据湖
二、大数据为什么需要数据湖


- Kafka无法支持海量数据存储。对于海量数据量的业务线来说,Kafka一般只能存储非常短时间的数据,比如最近一周,甚至最近一天。
- Kafka无法支持高效的OLAP查询,大多数业务都希望能在DWD\DWS层支持即席查询的,但是Kafka无法非常友好地支持这样的需求。
- 无法复用目前已经非常成熟的基于离线数仓的数据血缘、数据质量管理体系。需要重新实现一套数据血缘、数据质量管理体系。
- Kafka不支持update/upsert,目前Kafka仅支持append。
三、数据湖与数据仓库的区别
- 存储数据类型
- 数据处理模式


边栏推荐
- QAbstractScrollArea、QScrollArea
- MP的几种查询方式
- LeetCode第三题(Longest Substring Without Repeating Characters)三部曲之一
- Learning Experience Sharing Seven: YOLOv5 Code Chinese Comments
- 受邀出席Rust开发者大会|Rust如何助力量化高频交易?
- 当POC遇见RPA:RPA项目顺利实施的关键
- ASP.NET Core 6框架揭秘实例演示[31]:路由“高阶”用法
- 使用无界队列的线程池会导致内存飙升吗?
- Running yum reports Error: Cannot retrieve metalink for reposit
- Problem solving in the process of using mosquitto
猜你喜欢

npm WARN config global `--global`, `--local` are deprecated. Use `--location解决方案

The exchange - string dp

企业级数据治理工作怎么开展?Datahub这样做

Challenge LeetCode1000 questions in 365 days - Day 047 Design Circular Queue Circular Queue
![[kali-information collection] (1.9) Metasploit + search engine tool Shodan](/img/d2/6fae03d7597daa908a6816abc34e04.png)
[kali-information collection] (1.9) Metasploit + search engine tool Shodan

翻译英语的软件-免费翻译软件-各种语言互相翻译

“纯C”实现——三子棋小游戏

受邀出席Rust开发者大会|Rust如何助力量化高频交易?

ssm web page access database data error

C#/VB.NET to add more lines more columns image watermark into the Word document
随机推荐
JSP中如何正确的填写include指令中的file路径呢?
Excel dynamic chart production
数字化转型中的低代码
darknet训练yolov4模型
运行yum报错Error: Cannot retrieve metalink for reposit
【kali-信息收集】(1.8)ARP侦查工具_Netdiscover
翁恺C语言程序设计网课笔记合集
【Acunetix-忘记密码】
腾讯云云函数SCF—入门须知
List排序 ,取最大值最小值
项目监控六大事项
Breaking the Boundary, Huawei's Storage Journey
5G网络切片技术
[kali-information collection] (1.9) Metasploit + search engine tool Shodan
使用无界队列的线程池会导致内存飙升吗?
jacoco的学习以及理解
What is the future of smartwatches?
爆款视频怎么做?这里或许有答案!
19、商品微服务-srv层实现
智能手表前景如何?