Gartner公司估计,数据质量工具的全球市场规模大约为每年十亿美元左右。而据Gartner分析师Ted Friedma说,这还是一个相对保守的数据,它表明有着大量的企业仍没有将数据质量流程自动化。很多原因导致组织不急于采用数据质量软件。
一方面,这些工具通常是非常昂贵并且需要大量专业知识,Friedman说。存在着一个矛盾:数据质量是一个业务问题,但是对于那些应该做出决策的业务人员来说,这些技术并不适用。另外一个广泛存在的障碍,就是IT和数据管理团队一般对投资数据质量所做的论证工作都糟糕透了。
他们辩称,建立一个业务案例并使购买数据质量工具获得通过并非易事。对于企业高管来说,数据质量可以是一个抽象概念;精确固然不错,但是相比商务智能(BI)应用的好处,数据质量的业务影响在起始阶段通常难以掌握。但是随着数据量的增长,以及依赖纯净数据的BI和分析应用对于业务成功变得越发关键,Friedman认为,对自动数据质量管理的追求将会逐渐成为必要,而非一个可选之项。
Michael Chalhoub,是Eagle Creek软件服务公司客户服务部的主管。他表示,要建立一个业务用例,好的开端就是做一个全面的成本效益分析,它可以从过去五年间甚至更长时间的已改善数据质量对预期的节省以及其他财务收益加以预测。
数据质量流程改善之契机
Chalhoub说,在大多数组织中,有着充足的改善空间,特别是如果当前的数据质量分析和修复完全是手工流程。要有助于归档已有问题,他建议从业务用户那里搜集关于数据质量问题的反馈。应该发展可量化的数据质量指标用来在解决已确认问题的过程中跟踪进展。然后,IT经理可以跟进并为业务和企业高管们展示数据质量工具的使用是如何能够帮助改善数据精确性和完整性的。
但是为了确保对买进业务的支持,有必要对数据清理行动的可能速度和持续时间做一实质性的描述,Chalhoub补充道。他说,支持者应该使用分阶段的方法明确地定义数据质量项目的目标,预期结果以及期望的时间表,这种方法内建有需要评估项目进度以及修改项目计划的检查和平衡措施。
David Loshin是Knowledge Integrity咨询公司的总裁,他认为在公司对其数据缺陷和相应问题处理计划(包括改变业务流程以最小化数据错误)有一个清楚的认识之前,应该避免购买数据质量软件。
“数据质量很大程度上是一个流程改善活动,它可以通过使用工具加以增强,而非将其颠倒过来,”Loshin如是说:“不要轻信那些市场信息所表明的所谓自动工具很容易实现。相反,看看你想要得到的好处,然后再审视你要获得这些好处所需要经历的流程。那可能会包含使用商业软件,但是IT经理们不应该对此提前妄加揣测。”
数据质量影响评估
对于一个大的业务用例来说,绊脚石往往是大多数组织没有做好对劣质数据负面效应量化的工作。Friedman说:“每个人都抱怨不良数据,但是很少有公司衡量这一影响。而这样做可以为数据质量流程和业务表现之间建立起一个清晰的连接。”
Friedman认为,要帮助案例购买数据质量工具的另外一条途径就是重点关注每个临时例子,以及整个组织中对数据问题的人为修复。
对社交媒体数据的收集和分析,传感器读取数据的关注越来越多,而其他形式的大数据也可以成为自动化数据质量策略的一个卖点。这让手工流程和自定义编码随着时间的推移更难站稳脚跟。
与此同时,Friedman引述了一些步骤可以让公司在不依赖新技术的情况下改善数据质量。例如,对业务人员进行培训,让他们对其自身如何能够影响数据质量和修改业务流程以减少不准确数据录入系统的机会有一个更好的理解。他说道:“很多公司的数据会反复经手很多人,因此他们的流程是过于复杂了。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
企业的数据科学团队如何挖掘数据价值
单纯地雇用数据科学家并不意味着企业能够充分利用数据科学带来的优势。来看看这些企业如何通过数据科学团队让数据价值最大化。
-
2017年分析型数据管理解决方案(DMSA)魔力象限(上)
分析型数据管理解决方案(DMSA)市场不断需要更多创新技术和更强的执行能力,以满足云端和本地部署以及云端与大数据产品组合的各种需求。
-
流数据分析带来的“速度与激情”
和构建大数据架构类似,支撑实时分析架构的软件种类繁多,这对于用户来说有利有弊。找到合适的技术,并把这些技术整合成一个有效的分析框架将是一个十分冒险的过程,一着不慎,满盘皆输。
-
年度数据仓库市场格局新鲜出炉 论技术论实力谁更受青睐?
国际数据管理分析机构The Information Difference在最新年度数据仓库市场格局(Big Data Warehouse Landscape)报告中,对全球前25家数据仓库厂商进行了评估。