当前位置:网站首页>数据使用要谨慎——不良数据带来严重后果
数据使用要谨慎——不良数据带来严重后果
2022-08-04 09:44:00 【海森大数据】
对于很多企业来讲,大数据已成为日常经营中十分重要的一环,数据也已成为企业有价值的资产。咨询机构Digital Realty最近发布的一项研究表明,数据为全球最富裕的七个国家(G7)的经济贡献了超过1.7万亿美元。这一规模相当于全球第十大经济体,并高于韩国、俄罗斯和加拿大。
遗憾的是 ,对大数据的高度重视导致了一些不好的决策。很多实体以牺牲数据质量为代价换取数据的可扩展性。结果,不良的数据给他们引来了一大堆的问题。
仅美国,不良数据(任何结构或管理不善的数据)每年都会造成该国损失超3万亿美元。无论是数据工程师不小心添加了一个额外的零,还是事物格式的差异,甚至是数据系统本身的问题,数据都可能出现很多问题。
不良数据是指那些错误、不完整、无法理解、错位、不相关和过时的数据。在实践中,不良数据会浪费销售的时间,干扰数据科学家的工作,以及将IT的时间耗费在同步无法相互通讯的系统上。这一切都会导致人们对数据失信,令管理层无法果断决策。它还渗透到所有业务领域,从根本上影响工每个人的生活和工作。
不良数据对业务产生负面影响的主要方式有四种:
减慢决策速度
导致更高的成本
扰乱日常流程
降低客户参与度
那么,企业应采取哪些措施来清理数据呢?
集中:清理不良数据不可一蹴而就,需要以长远眼光看待问题。首先,不要把重点放在理顺数据进入企业的不同渠道上,而是专注制定一套集中化数据管理策略,同时确保能从源头对数据进行检测。
整合:在大型企业和机构内,不同部门运行着多个数据库,还有一些不为人知的数据来源。如果企业在不同地点有多个分支机构,情况会更为复杂。整合和分类数据库以及信息库可最大限度减少不良数据的产生,促进企业数据的标准化。
标准化:分析数据,加深对数据的认知。不良数据的一大成因是企业的数据收集过程缺乏标准化。必须在企业内部以及供应商、合作伙伴之间实施一套标准化参数,最大限度减少不良数据进入企业的途径。
调查:了解数据污染的根本原因。即利用对标数据进行数据基准校正,厘清数据污染的本质。这将有助于修正异常并将数据恢复到未受污染的初始质量。
消除:数据重复是数据不准确的主要原因之一,尤其是当存在多个数据库时。过程中人为失误则可能加剧这一问题。通过整合数据,我们有机会消除重复数据,以达到标准化的基准。这一过程可能需要花费一些时间,但也是快速获取客户信息和提高商业智能的必要条件。
清洗:云平台、尤其是混合云有大量数据清洗工具可供选择,提供了一个清洗、净化数据的理想环境。
随着我们进一步进入商业数字时代,数据——清晰、正确和干净的数据——对于持续进步至关重要。
边栏推荐
猜你喜欢
随机推荐
2022-08-03 第六小组 瞒春 学习笔记
多了<audio controls=
[Punctuality Atom STM32 Serial] Chapter 4 STM32 First Experience Excerpted from [Punctual Atom] MiniPro STM32H750 Development Guide_V1.1
No module named 'flask_misaka' has been resolved [BUG solution]
学习在微信小程序中判断url的文件后缀格式
《福格行为模型》:如何养成好习惯?
tcp连接的细节
Win11如何隐藏输入法悬浮窗?
MindSpore:图算融合报错
PD 源码分析- Checker: region 健康卫士
cannot import name ‘import_string‘ from ‘werkzeug‘【bug解决】
Four common methods of network attacks and their protection
使用ClickHouse分析COS的清单和访问日志
加降息与BTC流动性事件策略研究
继承和static关键字
学习使用php把stdClass Object转array的方法整理
leetcode二叉树系列(一)
【正点原子STM32连载】第三章 开发环境搭建 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
rk3399-339 usb设备复合 总体流程
MindSpore:损失函数问题