当前位置:网站首页>数据产品不就是报表吗?大错特错!这分类里有大学问
数据产品不就是报表吗?大错特错!这分类里有大学问
2020-11-06 20:12:00 【帆软】
数据产品价值:为解决业务问题而存在。
不管什么样的产品,都是为了解决业务问题而存在,数据产品也不例外。数据产品,种类繁多,不同数据产品,所具有的数据功能组件不同。
为什么说是不同的数据产品呢?数据产品不就是报表吗?
数据产品分类:面向人群、使用场景、使用方法构成数据产品
数据面向人群不同,人群对数据的诉求不同,有些是取数,有些是分析。取数需要用SQL,分析需要用excel,不同人群的数据诉求,使用方法构成了数据产品。
面向人群可以分为TOB/TOC,可分为付费人群/免费人群。人群的使用方法可分为工具类/咨询类。对于大企业来说,数据产品大多自建,对于小企业来说,大多市场购买。
以上分类过于抽象,下面就实际案例详解数据产品。
TO B:外部购买-面向运营
TOB是指面向企业经营管理者,举个例子,今天我想在京东上买牙膏,在一顿操作猛如虎后,筛到了牙膏,下单,静等快递小哥上门。
牙膏厂商想知道自己最近的经营状况,TOB指商家对店铺经营信息的管理,即企业经营者的看数据诉求。
TOB数据的特点,数据量大、分散、数据关系复杂多变,业务场景决定数据关系。举例,我买LG的牙膏,我们来说说LG公司经营者看数据场景,首先我们来看看有什么样的业务数据,业务数据也可以叫事实数据,未经过任何处理及加工的原子数据。
面对多变的分析诉求,庞大的数据量,分散的业务数据,老办法,运营人员会将最明细业务数据导入到excel中,透视,vlookup解决上述分析问题。随着分析的点增多,excel需要的明细数据也越多,Excel遇到数据源更新,关系改动,最终excel崩了。
以上案例是指没有能力自己搭建数据仓库数据产品,用excel进行数据分析的企业经营者。
基于这种背景,企业需要去外部市场购买数据产品。目前业内比较出名的有阿里的QuickBI,帆软的FineBI,tableau等,这种数据产品为不能搭建数据体系的用户提供了帮助,从ODS到DWD到APP,将数据仓的搭建交由用户自己负责(下图的数据源介入,数据关联)。下图是FineBI的数据功能组件。
抽象了excel的一部分能力,只要人员懂业务,就可以上手分析数据,不需要组建数据团队,再去维护数据
TO B:企业自建-面向运营/产品
以上例子是TOB˙中外部采买数据产品的例子。产品的弊端在于需要把原生态的业务数据上传到对方服务器中,虽然说平台保证数据安全,但是互联网的大企业还是不相信。在人力资源够用的情况下,公司出于数据安全的角度,还是自己玩吧。
内部的数据产品是围绕业务去做的,数据需要跟随业务的变动而变动,跟上业务且领先于业务是内部数据产品的衡量标准。这种数据产品形态上主要以报表为主,且分不同的业务模块;可视化为辅,定向一些指标观测数据;监控内容打野,随时保证业务健康。
此类数据产品坑多在于业务口径,业务的前瞻性,数据的前瞻性,决定了数据的稳定性。业务的抽象能力、逻辑思维能力,决定产品形态的稳定性。如果做不到,天天就会被业务吊打,掉入查数姑和大表哥的坑。
TO B:企业自建-面向开发
对比于FineBI是不是发现少了什么东西呢?数据清洗,数据加工功能在哪里呢?当然我们有自己的数据仓库,加工和清洗也都在我们自己的数仓中消化。
58的slogan,“人人信赖的生活服务平台”,6个业务线上千种类目,你的所有需求都能在58平台上满足,难道我们自己的数据仓库是直接对接的58这么多的类目吗?显然不是的。在58内部数据还有更细的分工。
举例:部门的业务目标ROI>1,尽可能多地促成C端用户和商家的联系。ROI等于收益除以花费。我们有媒体侧的数据曝光、点击、花费,我们有商家付出的成本,我们有C端用户感兴趣的信息,有些数据我们需要明细,有些数据我们需要汇总,这么庞大的数据,这么复杂的数据交互都是怎么实现的呢?
这就诞生了面向开发的数据工具,即大数据处理工具,为了实现数据资产共享,提高数据运算性能,减少资源消耗而诞生的数据产品。
数据抽取:
以上案例均为TOB行业的产品案例,分为TOB企业购买,TO企业自建,企业自建又可以分为面向运营(业务),面向开发。
这几种TOB的数据产品对于从业者的技能要求是不同的。对于QuickBI,对于excel的功能需要非常清楚,是否某些excel的功能可以移植到平台上(我猜的),要学习的不仅有excel使用,数据存储,数据解析,数据运行原理,每个功能背后都对应一种技能,这方面我也是小白,所以就不细讲了。
对应的TOB面运营的,主要考验产品的业务能力,逻辑思维能力,个人感觉相对简单一些。对应的TOB面向开发的,需要懂开发环境,开发的数据处理流程,开发的数据处理工具,工具的使用方法,包含调度内存占用等等。猜测和FineBI获取数据,创建数据集是同样的从业者技能吧。
好了,今天就先写TOB的吧,TOC只能放在下次说了,待续。
版权声明
本文为[帆软]所创,转载请带上原文链接,感谢
https://my.oschina.net/u/4197558/blog/4705498
边栏推荐
猜你喜欢
DRF JWT authentication module and self customization
快快使用ModelArts,零基础小白也能玩转AI!
如何对Pandas DataFrame进行自定义排序
网络安全工程师演示:原来***是这样获取你的计算机管理员权限的!【维持】
Cos start source code and creator
谁说Cat不能做链路跟踪的,给我站出来
01 . Go语言的SSH远程终端及WebSocket
windows10 tensorflow(二)原理实战之回归分析,深度学习框架(梯度下降法求解回归参数)
【C/C++ 2】Clion配置与运行C语言
python过滤敏感词记录
随机推荐
Elasticsearch 第六篇:聚合統計查詢
[C#] (原創)一步一步教你自定義控制元件——04,ProgressBar(進度條)
自然语言处理-搜索中常用的bm25
企业数据库的选择通常由系统架构师主导决策 - thenewstack
Technical director, to just graduated programmers a word - do a good job in small things, can achieve great things
Jmeter——ForEach Controller&Loop Controller
Introduction to Google software testing
hadoop 命令总结
mac 安装hanlp,以及win下安装与使用
文本去重的技术方案讨论(一)
GUI 引擎评价指标
Listening to silent words: hand in hand teaching you sign language recognition with modelarts
The practice of the architecture of Internet public opinion system
遞迴思想的巧妙理解
怎么理解Python迭代器与生成器?
用Python构建和可视化决策树
谁说Cat不能做链路跟踪的,给我站出来
如何成为数据科学家? - kdnuggets
3分钟读懂Wi-Fi 6于Wi-Fi 5的优势
[performance optimization] Nani? Memory overflow again?! It's time to sum up the wave!!