当前位置:网站首页>Flink 在 讯飞 AI 营销业务的实时数据分析实践
Flink 在 讯飞 AI 营销业务的实时数据分析实践
2022-07-26 11:39:00 【InfoQ】
- 业务简介
- 数仓演进
- 场景实践
- 未来展望
一、业务简介


二、数仓演进




三、场景实践
3.1 ODS - 日志消费负载均衡



3.2 DWD - 日志关联及状态缓存





3.3 DWS - 实时 OLAP


3.4 ADS - 跨源查询

3.5
流批混合现状

- 响应快,秒级输出;
- 可重入性差,难以重复计算历史日志;
- 流的持续性重要,异常需迅速介入。
- 响应慢,小时级输出;
- 可重入性好,可重复计算历史数据;
- 数据按小时粒度管理,个别异常可从容处理。
- 两遍日志清洗的计算量;
- 两套技术框架;
- 数据一致性问题。
四、未来展望

- 避免了对日志的重复清洗;
- 统一了建模的技术框架;
- 支持延迟数据对模型的更新。
- 实时模型重复,量级更大,计算消耗大;
- 支持数据更新的技术如 Hudi,会改变模型的使用方式,对后续使用者不友好。



边栏推荐
- 什么是Per-Title编码?
- Data center construction (II): brief introduction to data center
- 浅谈Web Vitals
- 开放原子开源基金会OpenHarmony工作委员会主席侯培新寄语OpenAtom OpenHarmony分论坛
- 数据数据湖(十九):SQL API 读取Kafka数据实时写入Iceberg表
- 3dunity game project actual combat - aircraft war
- [communication principle] Chapter 3 -- random process [i]
- 线上一个隐匿 Bug 的复盘
- Understanding useref is enough
- 武林头条-建站小能手争霸赛
猜你喜欢

初试YOLOv7

Metauniverse gamefi chain game system development NFT Technology

Harbor2.2 quick check of user role permissions

Esp8266 Arduino programming example - development environment construction (based on Arduino IDE)

Data type of SQL Server database

大咖观点+500强案例,软件团队应该这样提升研发效能!

Talking about web vitals

Pyechart offline deployment

28. Implementation of file directory parsing code

CVPR 2022 单目深度估计新SOTA—NeW CRFs:Neural Window Fullyconnected CRFs
随机推荐
3.2 创建菜单与游戏页面(下)
Redis database, which can be understood by zero foundation Xiaobai, is easy to learn and use!
音视频+
建模杂谈系列150 SCLC工程化实验3-SRule
Modeling essay series 150 SCLC engineering experiment 3-srule
Build neural network from simple to deep
SQL statement of SQL server creates database
"Mongodb" mongodb high availability deployment architecture - replica set
正点原子stm32中hal库iic模拟`#define SDA_IN() {GPIOB->MODER&=~(3<<(9*2));GPIOB->MODER|=0<<9*2;}` //PB9 输入模式
滴滴被罚80亿!拿用户数据赚钱的时代结束了
The latest heart-shaped puzzle applet source code + with flow master
Substance painter 2021 software installation package download and installation tutorial
c语言代码量统计工具
Esp8266 Arduino programming example - development environment construction (based on Arduino IDE)
Win10 uses NVM to install node, NPM, and cnpm
[error reported]exception: found duplicate column (s) in the data schema: `value`;
[cloud resident co creation] decrypt how sparkrtc realizes ultra-low latency interaction globally
Can you believe it? It took me only two days to develop a management system
swagger2.9.2教程 与swagger3.0.0教程
Hal library IIC simulation in punctual atom STM32 `define SDA_ IN() {GPIOB->MODER&=~(3<<(9*2));GPIOB->MODER|=0<<9*2;}` // PB9 input mode