当前位置:网站首页>数据使用要谨慎——不良数据带来严重后果
数据使用要谨慎——不良数据带来严重后果
2022-08-04 09:44:00 【海森大数据】
对于很多企业来讲,大数据已成为日常经营中十分重要的一环,数据也已成为企业有价值的资产。咨询机构Digital Realty最近发布的一项研究表明,数据为全球最富裕的七个国家(G7)的经济贡献了超过1.7万亿美元。这一规模相当于全球第十大经济体,并高于韩国、俄罗斯和加拿大。
遗憾的是 ,对大数据的高度重视导致了一些不好的决策。很多实体以牺牲数据质量为代价换取数据的可扩展性。结果,不良的数据给他们引来了一大堆的问题。
仅美国,不良数据(任何结构或管理不善的数据)每年都会造成该国损失超3万亿美元。无论是数据工程师不小心添加了一个额外的零,还是事物格式的差异,甚至是数据系统本身的问题,数据都可能出现很多问题。
不良数据是指那些错误、不完整、无法理解、错位、不相关和过时的数据。在实践中,不良数据会浪费销售的时间,干扰数据科学家的工作,以及将IT的时间耗费在同步无法相互通讯的系统上。这一切都会导致人们对数据失信,令管理层无法果断决策。它还渗透到所有业务领域,从根本上影响工每个人的生活和工作。
不良数据对业务产生负面影响的主要方式有四种:
减慢决策速度
导致更高的成本
扰乱日常流程
降低客户参与度
那么,企业应采取哪些措施来清理数据呢?
集中:清理不良数据不可一蹴而就,需要以长远眼光看待问题。首先,不要把重点放在理顺数据进入企业的不同渠道上,而是专注制定一套集中化数据管理策略,同时确保能从源头对数据进行检测。
整合:在大型企业和机构内,不同部门运行着多个数据库,还有一些不为人知的数据来源。如果企业在不同地点有多个分支机构,情况会更为复杂。整合和分类数据库以及信息库可最大限度减少不良数据的产生,促进企业数据的标准化。
标准化:分析数据,加深对数据的认知。不良数据的一大成因是企业的数据收集过程缺乏标准化。必须在企业内部以及供应商、合作伙伴之间实施一套标准化参数,最大限度减少不良数据进入企业的途径。
调查:了解数据污染的根本原因。即利用对标数据进行数据基准校正,厘清数据污染的本质。这将有助于修正异常并将数据恢复到未受污染的初始质量。
消除:数据重复是数据不准确的主要原因之一,尤其是当存在多个数据库时。过程中人为失误则可能加剧这一问题。通过整合数据,我们有机会消除重复数据,以达到标准化的基准。这一过程可能需要花费一些时间,但也是快速获取客户信息和提高商业智能的必要条件。
清洗:云平台、尤其是混合云有大量数据清洗工具可供选择,提供了一个清洗、净化数据的理想环境。
随着我们进一步进入商业数字时代,数据——清晰、正确和干净的数据——对于持续进步至关重要。
边栏推荐
猜你喜欢
随机推荐
Win11系统重装用什么好 一键重装Win11教程
JDBC知识点
字符串相关题目
Ansible deployment scripts - pro available without pit
Win10电脑经常发出叮咚声音怎么关闭
开源一夏 | 查询分页不只有limit,这四种分页方法值得掌握
交换机链路聚合详解【华为eNSP】
参数优化。
【正点原子STM32连载】第一章 本书学习方法 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
超宽带UWB实时精准定位,短距离无缝交互应用,物联网厘米级精度方案
已解决No module named ‘flask_misaka‘【BUG解决】
LeetCode581+621+207
VRRP + MSTP configuration, huawei eNSP experiment 】 【
Anton Paar安东帕密度计比重计维修DMA35性能参数
Detailed explanation of telnet remote login aaa mode [Huawei eNSP]
Libtomcrypt AES 加密及解密
冰蝎工具开发实现动态二进制加密WebShell
双指针方法
并发编程之生产者和消费者问题
无线Mesh自组网方案,CV5200无线模组应用,支持高清数据远距离传输