当前位置:网站首页>一些企业数据平台建设的思考
一些企业数据平台建设的思考
2022-07-28 13:27:00 【InfoQ】
什么是企业数据平台
数据在企业中如何应用
SQLPython数据平台功能
- 数据接入支持,需要提供一个接口以便业务团队可以快速的把数据接入到数据平台。
- 数据开发支持,需要提供接口用于进行数据计算,以便可以算出数据指标提供给bi工具。
- 任务调度支持,需要将上述的计算程序周期性的调度起来,以便可以周期性的计算出数据指标。
- 探索式数据分析支持,提供
SQL和Python接口给数据分析师使用。
- 数据安全管理。比如数据权限控制,实现无权限读写的数据无法读写,权限申请流程简单等;还比如数据脱敏控制等。
- 数据质量管理。比如可以方便的查询数据标准,根据数据标准执行数据检查等。
- 数据发现支持,便于平台使用者可以快速的找到数据和理解数据。这里就会包括数据目录,元数据管理,数据血缘管理等一系列数据管理功能。
- 数据建模能力支持
- 分层的数据架构支持
- 维护数据开发规范、设计建议、最佳实践等指导性的文档

数据平台建设思路
中心化还是非中心化
- 可以避免各个团队重复建设带来的资源浪费
- 统一的数据管理可以更好更快的推进企业内部的数据策略的落地,比如数据标准,数据安全等
- 实现计算和存储资源共享,节省开支
- 更方便的实现跨业务线数据集成
采用精益的思想来逐步构建数据平台
- 组建一个数据平台团队
- 基于开源技术搭建一个具备基本功能的数据平台
- 为了实现某一个业务指标计算,接入某一个系统的数据,从而顺便完成了一定的平台数据接入功能
- 为了实现某一个机器学习模型,接入另一个系统的数据,从而顺便增强了之前的平台数据接入功能,且顺便完成了某一些通用的可复用的指标的计算
- 为了支持更多的探索性数据分析,根据需要,数据平台支持了自助式的以SQL为接口的数据分析
- 为了支持更多的探索性数据分析,根据需要,数据平台支持了自助式的以Python为接口的数据分析
- 根据数据安全的需要,数据平台完善了对于数据权限的管理,数据加密脱敏的支持
- 随着数据平台功能逐步完善,业务团队更多的自助的进行数据接入和数据分析,数据平台团队则专注在平台功能不断增强及平台稳定性维护上面
- …
总结
边栏推荐
- qml 图片预览
- Four ways to create thread pools
- Collaborative office tools: Online whiteboard is in its infancy, and online design has become a red sea
- 多级缓存方案
- UFIDA BiP CRM new product launch enables large and medium-sized enterprises to grow their marketing
- 一文读懂如何部署具有外部数据库的高可用 K3s
- 83.(cesium之家)cesium示例如何运行
- LeetCode 1331.数组序号转换
- Leetcode 105. construct binary tree from preorder and inorder traversal sequence & 106. construct binary tree from inorder and postorder traversal sequence
- Leetcode 0142. circular linked list II
猜你喜欢

深度学习基础----GNN谱域和空域 (不断完善更新积累)

开源项目丨Taier1.2版本发布,新增工作流、租户绑定简化等多项功能

Development and definition of software testing

Multithreading and high concurrency (III) -- source code analysis AQS principle

目标检测:速度和准确性比较(Fater R-CNN,R-FCN,SSD,FPN,RetinaNet和YOLOv3)

JMeter installation tutorial and login add token

在centos中安装mysql5.7.36

Install mysql5.7.36 in CentOS

走进音视频的世界——FLV视频封装格式

These three online PS tools should be tried
随机推荐
【翻译】盐业公司来Linkerd公司是为了负载平衡,留下来是为了效率、可靠性和性能。...
【LeetCode】1331. 数组序号转换
2022年安全员-A证操作证考试题库模拟考试平台操作
开源项目丨Taier1.2版本发布,新增工作流、租户绑定简化等多项功能
Security assurance is based on software life cycle -psp application
qml 图片预览
Several efficient APIs commonly used in inventory operation URL
【Try to Hack】HFish蜜罐部署
Redis sentinel mechanism
LeetCode 1331.数组序号转换
webSocket聊天
在centos中安装mysql5.7.36
Verification code brute force cracking test [easy to understand]
Jmeter安装教程及登录增加token
深度学习基础----GNN谱域和空域 (不断完善更新积累)
Thrift 序列化协议浅析
2022年熔化焊接与热切割考题及在线模拟考试
Database optimization understanding these is enough
【Util】redis工具类:把redis的value序列化器修改为GenericJackson2JsonRedisSerializer,就支持返回值为对象或集合了
Daily question - Scholarship