当前位置:网站首页>数据使用要谨慎——不良数据带来严重后果
数据使用要谨慎——不良数据带来严重后果
2022-08-04 09:44:00 【海森大数据】

对于很多企业来讲,大数据已成为日常经营中十分重要的一环,数据也已成为企业有价值的资产。咨询机构Digital Realty最近发布的一项研究表明,数据为全球最富裕的七个国家(G7)的经济贡献了超过1.7万亿美元。这一规模相当于全球第十大经济体,并高于韩国、俄罗斯和加拿大。
遗憾的是 ,对大数据的高度重视导致了一些不好的决策。很多实体以牺牲数据质量为代价换取数据的可扩展性。结果,不良的数据给他们引来了一大堆的问题。
仅美国,不良数据(任何结构或管理不善的数据)每年都会造成该国损失超3万亿美元。无论是数据工程师不小心添加了一个额外的零,还是事物格式的差异,甚至是数据系统本身的问题,数据都可能出现很多问题。
不良数据是指那些错误、不完整、无法理解、错位、不相关和过时的数据。在实践中,不良数据会浪费销售的时间,干扰数据科学家的工作,以及将IT的时间耗费在同步无法相互通讯的系统上。这一切都会导致人们对数据失信,令管理层无法果断决策。它还渗透到所有业务领域,从根本上影响工每个人的生活和工作。
不良数据对业务产生负面影响的主要方式有四种:
减慢决策速度
导致更高的成本
扰乱日常流程
降低客户参与度

那么,企业应采取哪些措施来清理数据呢?
集中:清理不良数据不可一蹴而就,需要以长远眼光看待问题。首先,不要把重点放在理顺数据进入企业的不同渠道上,而是专注制定一套集中化数据管理策略,同时确保能从源头对数据进行检测。
整合:在大型企业和机构内,不同部门运行着多个数据库,还有一些不为人知的数据来源。如果企业在不同地点有多个分支机构,情况会更为复杂。整合和分类数据库以及信息库可最大限度减少不良数据的产生,促进企业数据的标准化。
标准化:分析数据,加深对数据的认知。不良数据的一大成因是企业的数据收集过程缺乏标准化。必须在企业内部以及供应商、合作伙伴之间实施一套标准化参数,最大限度减少不良数据进入企业的途径。
调查:了解数据污染的根本原因。即利用对标数据进行数据基准校正,厘清数据污染的本质。这将有助于修正异常并将数据恢复到未受污染的初始质量。
消除:数据重复是数据不准确的主要原因之一,尤其是当存在多个数据库时。过程中人为失误则可能加剧这一问题。通过整合数据,我们有机会消除重复数据,以达到标准化的基准。这一过程可能需要花费一些时间,但也是快速获取客户信息和提高商业智能的必要条件。
清洗:云平台、尤其是混合云有大量数据清洗工具可供选择,提供了一个清洗、净化数据的理想环境。
随着我们进一步进入商业数字时代,数据——清晰、正确和干净的数据——对于持续进步至关重要。
边栏推荐
猜你喜欢

PD 源码分析- Checker: region 健康卫士

rk3399-339 usb设备复合 总体流程

Libtomcrypt AES 加密及解密

NAT/NAPT地址转换(内外网通信)技术详解【华为eNSP】

EastWave应用:自动计算光子晶体透反率
![[Punctuality Atom STM32 Serial] Chapter 4 STM32 First Experience Excerpted from [Punctual Atom] MiniPro STM32H750 Development Guide_V1.1](/img/99/928e86f8a61a905a899dd5d3880def.png)
[Punctuality Atom STM32 Serial] Chapter 4 STM32 First Experience Excerpted from [Punctual Atom] MiniPro STM32H750 Development Guide_V1.1

双指针方法

2022 Cloud Native Computing代表厂商 | 灵雀云第三次入选Gartner中国ICT技术成熟度曲线报告
![一道[CSCCTF 2019 Qual]FlaskLight的详解再遇SSTI](/img/98/8b2359b7b99da9e50821cdaaf5e47d.png)
一道[CSCCTF 2019 Qual]FlaskLight的详解再遇SSTI

命里有时终须有--记与TiDB的一次次擦肩而过
随机推荐
【正点原子STM32连载】第二章 STM32简介 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
telnet远程登录aaa模式详解【华为eNSP】
leetcode动态规划经典例题——53.最大子数组和
LVGL's multi-language conversion tool -- a good assistant for font settings
Acwing 3208. Z字形扫描 偏移量+扩展图
密码字典生成工具pydictor/john
陈春花发布声明,这场流量狂欢该到了收尾的时候
Inheritance and the static keyword
usb设备复合g_webcam摄像头码流传输功能以及g_serial串口功能
2022-08-03 第六小组 瞒春 学习笔记
四大网络攻击常见手段及防护
并发编程之生产者和消费者问题
PD 源码分析- Checker: region 健康卫士
关于DSP驱动外挂flash
超宽带UWB实时精准定位,短距离无缝交互应用,物联网厘米级精度方案
【C补充】指向指针或函数的指针
架构设计杂谈
TCP协议 - 三次握手 - 四次挥手-内核参数调优
[Cloud Residency Co-Creation] HCSD Celebrity Live Streaming – Employment Guide
[Punctuality Atom STM32 Serial] Chapter 3 Development Environment Construction Excerpted from [Punctual Atom] MiniPro STM32H750 Development Guide_V1.1