当前位置:网站首页>flink基本原理及应用场景分析
flink基本原理及应用场景分析
2022-08-05 05:14:00 【bigdata1024】
Apache Flink 是一个开源的分布式,高性能,高可用,准确的流处理框架。支持实时流处理和批处理
flink特性
- 支持批处理和数据流程序处理
- 优雅流畅的支持java和scala api
- 同时支持高吞吐量和低延迟
- 支持事件处理和无序处理通过SataStream API,基于DataFlow数据流模型
- 在不同的时间语义(时间时间,处理时间)下支持灵活的窗口(时间,技术,会话,自定义触发器)
- 仅处理一次的容错担保
- 自动反压机制
- 图处理(批) 机器学习(批) 复杂事件处理(流)
- 在dataSet(批处理)API中内置支持迭代程序(BSP)
- 高效的自定义内存管理,和健壮的切换能力在in-memory和out-of-core中
- 兼容hadoop的mapreduce和storm
- 集成YARN,HDFS,Hbase 和其它hadoop生态系统的组件
flink的应用场景
- 优化电子商务的实时搜索结果:阿里巴巴的所有基础设施团队使用flink实时更新产品细节和库存信息,为用户提供更高的关联性。
- 针对数据分析团队提供实时流处理服务:king通过flink-powered数据分析平台提供实时数据分析,从游戏数据中大幅缩短了观察时间
- 网络/传感器检测和错误检测:Bouygues电信公司,是法国最大的电信供应商之一,使用flin监控其有线和无线网络,实现快速故障响应。
- 商业智能分析ETL:Zalando使用flink转换数据以便于加载到数据仓库,将复杂的转换操作转化为相对简单的并确保分析终端用户可以更快的访问数据。
基于上面的案例分析,Flink非常适合于:
- 多种数据源(有时不可靠):当数据是由数以百万计的不同用户或设备产生的,它是安全的假设数据会按照事件产生的顺序到达,和在上游数据失败的情况下,一些事件可能会比他们晚几个小时,迟到的数据也需要计算,这样的结果是准确的。
- 应用程序状态管理:当程序变得更加的复杂,比简单的过滤或者增强的数据结构,这个时候管理这些应用的状态将会变得比较难(例如:计数器,过去数据的窗口,状态机,内置数据库)。flink提供了工具,这些状态是有效的,容错的,和可控的,所以你不需要自己构建这些功能。
- 数据的快速处理:有一个焦点在实时或近实时用例场景中,从数据生成的那个时刻,数据就应该是可达的。在必要的时候,flink完全有能力满足这些延迟。
- 海量数据处理:这些程序需要分布在很多节点运行来支持所需的规模。flink可以在大型的集群中无缝运行,就像是在一个小集群一样。
Flink入门及实战-上:
Flink入门及实战-下:
获取更多大数据资料,视频以及技术交流请加群:
边栏推荐
- 周末作业-循环练习题(2)
- ES6基础语法
- [Student Graduation Project] Design and Implementation of the Website Based on the Web Student Information Management System (13 pages)
- CAP+BASE
- The mall background management system based on Web design and implementation
- 【过一下11】随机森林和特征工程
- Do you use tomatoes to supervise your peers?Add my study room, come on together
- 【过一下14】自习室的一天
- Difference between for..in and for..of
- Returned object not currently part of this pool
猜你喜欢
第二讲 Linear Model 线性模型
The fourth back propagation back propagation
Lecture 4 Backpropagation Essays
[Go through 4] 09-10_Classic network analysis
【过一下14】自习室的一天
Matplotlib(二)—— 子图
Lecture 5 Using pytorch to implement linear regression
第四讲 反向传播随笔
[Go through 7] Notes from the first section of the fully connected neural network video
server disk array
随机推荐
Structured Light 3D Reconstruction (2) Line Structured Light 3D Reconstruction
1.3 mysql批量插入数据
[WeChat applet] WXML template syntax - conditional rendering
【读书】长期更新
学习总结week2_5
JSX基础
Distributed and Clustered
Matplotlib(二)—— 子图
What field type of MySQL database table has the largest storage length?
Matplotlib(三)—— 实践
[Student Graduation Project] Design and Implementation of the Website Based on the Web Student Information Management System (13 pages)
OFDM Lecture 16 5 -Discrete Convolution, ISI and ICI on DMT/OFDM Systems
学习总结week3_2函数进阶
HQL语句执行过程
第四讲 back propagation 反向传播
day8字典作业
数据库 单表查询
[Go through 7] Notes from the first section of the fully connected neural network video
第四讲 反向传播随笔
flink实例开发-batch批处理实例