当前位置:网站首页>主流实时流处理计算框架Flink初体验
主流实时流处理计算框架Flink初体验
2022-07-01 09:36:00 【InfoQ】
概述

特点
- 低延时实时流处理
- 代码编写简单Flink 已经是最近几代通用大数据框架之一,相对一系列老前辈来说应用广泛、使用简单。
- 支持大型、复杂的状态处理允许有数百 GB 以上的状态存储。
- 支持大规模分布式部署自身有 Standalone 集群模式,也支持部署到 Yarn、K8S 上。
- 迭代速度快
- 结果准确性和良好的容错性
使用的一般场景
- 机器资源非常的多:能够提供至少 24 个 CPU 核心和百 GB 以上的内存,Flink 所在的机器硬盘必须为 SSD
- 吞吐量大或未来扩展要求很大:每秒一万条只能勉强算大,十万条可以算大
- 需求复杂:有大量复杂的清洗、去重、转换等操作 对低延时有极高要求:10
- 秒以内的延迟才能算作低延迟,1 秒以内的延迟要求就需要非常仔细地处理
事件驱动

流处理和批处理
批处理
流处理
两者区别对比
- 数据时效性
- 数据特征
- 应用场景
- 运行方式
- 处理效能
Flink中的数据处理方式
无界流
有界流

Flink编程模型(API)

边栏推荐
猜你喜欢
随机推荐
SQL learning notes (02) - database table operation
ES6 const essence and completely immutable implementation (object.free)
集成积木报表报错 org.apache.catalina.core.StandardContext.filterStart 启动过滤器异常
nacos服务配置和持久化配置
Swift control encapsulation - paging controller
树结构---二叉树2非递归遍历
JS原型链
Problems caused by delete and delete[]
123. how to stop a thread?
3D printing Arduino four axis aircraft
2.4 activation function
[ESP nanny level tutorial preview] crazy node JS server - Case: esp8266 + MQ Series + nodejs local service + MySQL storage
Log4j log framework
2.2 【pytorch】torchvision. transforms
2.3 【pytorch】数据预处理 torchvision.datasets.ImageFolder
Can diffusion models be regarded as an autoencoder?
The market is relatively weak recently
IPv6 learning notes
[ESP nanny level tutorial] crazy completion chapter - Case: ws2812 light control system based on Alibaba cloud, applet and Arduino
2.2 【pytorch】torchvision.transforms