当前位置:网站首页>BI的边界:BI不适合做什么?主数据、MarTech?该如何扩展?
BI的边界:BI不适合做什么?主数据、MarTech?该如何扩展?
2022-07-07 17:54:00 【派可数据BI可视化】
我们在一些客户现场和客户沟通的时候,客户经常会提到一些场景和问题,问能不能在BI里面解决。
BI不擅长做什么
比如上了BI之后,所有的数据从数据源抽取到BI层面进行加工,数据都处理的很规范,但是业务系统中的数据仍然不规范,数据质量的问题并没有得到真正的解决。还有就是上了BI之后,想利用一些数据对符合条件的用户做一些信息推送、精准营销,用户收到信息之后的反馈也希望能够沉淀到BI数据仓库中,等等诸如此类的需求。
BI - 派可数据BI可视化分析平台
实际上严格来讲,这些都不是BI所擅长的领域。BI 所擅长的仍然是打通各类数据系统,并通过BI数据仓库建模构建各类合理的分析模型,对外以可视化报表的形式提供给管理层做决策支撑,或者通过深入的BI分析定位企业业务和管理中的问题,最终要不要做决策、做什么样的决策还是由人来决定。
那么刚才讲到的两个场景实际上一个是位于BI的上游入口端,一个是位于BI的下游出口端。
BI上游数据问题
数据源头的数据质量问题BI是无法解决的,BI能解决的只是将数据源头的数据拉入到BI数据仓库中,通过ETL完成数据的合并、清洗、治理工作,将不规范的、不可分析的数据变成规范的、可分析的数据形式支撑前端可视化分析。
BI数据仓库 - 派可数据BI可视化分析平台
比如我们经常见到的在一些企业,信息化系统的规划都是分阶段进行的,不同的系统不同的部门在使用,由于缺乏一定的提前统一规范,再加上不同的业务部门使用不同的系统比如对产品编码、供应商档案信息的维护不一致,结果就造成在BI取数建模的时候就不知道到底以哪一套系统的维度档案数据为主,就需要花费大量的时间、精力来处理这类数据的合并、脏数据的剔除等开发工作。
所以,对于这些数据质量的控制、脏数据的清洗都后置到BI层面来处理了。如果要前置处理的话,就需要依赖主数据系统、数据治理系统在数据源头上做处理控制,建立统一的主数据档案信息,所有的维度档案都统一由主数据系统控制,再分发到各个业务系统建立统一的数据标准。
或者在规划建设每一个业务信息化系统的时候建立数据档案标准,遵循一定的数据规则,这也是数据质量、数据档案信息、数据规范的前置。所以这一类的数据处理要么前置到上BI之前来解决,要么后置到BI层面来处理。但在BI层面来处理,BI 就只能对往外输出的数据质量做控制,是无法逆向回溯到数据源头解决数据源头的数据质量、数据标准问题。
BI下游输出问题
刚才讲到的是BI的上游数据问题,再来谈谈BI的下游往外输出的问题,比如最开始提到的要做一些用户分群、做一些精准营销,比如在市场营销领域的 MarTech。实际上它的处理流程也是采集各类内部系统、外部环境的数据做加工处理,按照一定的逻辑计算规则构建一些模型,再根据一定的场景来使用这些数据做一些营销工作,这部分目前也不是BI所擅长的。
可视化大屏 - 派可数据BI可视化分析平台
BI 的定位刚才也已经讲过是在内部数据仓库建完分析模型的时候,对前端可视化分析负责。也就是说到前端可视化这个层面就结束了,不会介入到后续的业务流程处理上,比如营销推广就是一种业务流程处理过程。但是实际上看看刚才的数据处理过程,和BI的ETL过程也都是非常类似的,都需要采集各类数据库、接口的不管是外部的还内部的数据,也都需要进行非常复杂的数据处理,建立模型。
BI扩展能力
根据对BI问题的分析,我们会发现BI如果要往下走一步,实际上就是到了数据服务的环节了,通过对外提供数据服务介入到后续的业务环节,这样就实现了BI和后续业务流程的对接和打通。这种场景的应用领域非常宽泛,像刚才提到的市场营销、零售行业的智能补货、库存的智能预警等等。
BI扩展 - 派可数据BI可视化分析平台
所以,BI 领域的上下游扩展能力还是很强的,它的上下游两端都是业务系统,一种是提供数据来源的业务系统,一种是通过规范性的数据打入到下游的业务系统,而中间就是BI的核心处理环节。
往上,BI 可以扩充到主数据、数据治理。往下,BI通过数据服务扩充到各个细分领域的数据应用场景,但它的行业性特征比较强。这些都是未来BI可以发展的一个方向。
实际上,再讲到这里,大家是不是也感觉和现在的数据中台是不是有些类似了,三大环节:数据采集、数据处理、数据服务。所以,很多技术概念基本上都是大同小异的,只是他们的定位、偏向性、行业性、业务性的不同就形成了不同的解决方案来解决一些特定的场景问题。
边栏推荐
- A pot of stew, a collection of common commands of NPM and yarn cnpm
- R语言dplyr包select函数、group_by函数、filter函数和do函数获取dataframe中指定因子变量中指定水平中特定数值数据列的值第三大的值
- 最多可以参加的会议数目[贪心 + 优先队列]
- 2022年投资哪个理财产品收益高?
- torch.nn.functional.pad(input, pad, mode=‘constant‘, value=None)记录
- IP tools
- Detailed explanation of Flink parallelism and slot
- 模拟实现string类
- MySQL、sqlserver oracle数据库连接方式
- How to cooperate among multiple threads
猜你喜欢
YoloV6:YoloV6+Win10---训练自己得数据集
编译器优化那些事儿(4):归纳变量
谷歌seo外链Backlinks研究工具推荐
Detailed explanation of Flink parallelism and slot
Ways to improve the utilization of openeuler resources 01: Introduction
位运算介绍
小试牛刀之NunJucks模板引擎
RESTAPI 版本控制策略【eolink 翻译】
ASP.NET幼儿园连锁管理系统源码
Chapter 9 Yunji datacanvas was rated as 36 krypton "the hard core technology enterprise most concerned by investors"
随机推荐
Notes...
R language ggplot2 visualization: use the ggviolin function of ggpubr package to visualize the violin diagram, set the palette parameter to customize the filling color of violin diagrams at different
Equals method
torch. nn. functional. Pad (input, pad, mode= 'constant', value=none) record
ASP.NET幼儿园连锁管理系统源码
位运算介绍
Interpretation of transpose convolution theory (input-output size analysis)
2022年投资哪个理财产品收益高?
Time tools
R语言fpc包的dbscan函数对数据进行密度聚类分析、查看所有样本的聚类标签、table函数计算聚类簇标签与实际标签构成的二维列联表
[sword finger offer] sword finger offer II 012 The sum of left and right subarrays is equal
ASP.NET体育馆综合会员管理系统源码,免费分享
pom. XML configuration file label: differences between dependencies and dependencymanagement
Ucloud is a basic cloud computing service provider
el-upload上传组件的动态添加;el-upload动态上传文件;el-upload区分文件是哪个组件上传的。
SQL common optimization
Automatic classification of defective photovoltaic module cells in electroluminescence images-论文阅读笔记
多个线程之间如何协同
Make this crmeb single merchant wechat mall system popular, so easy to use!
LC: string conversion integer (ATOI) + appearance sequence + longest common prefix