数据的变化会直接影响数据工作行为,非结构化和半结构化数据的出现就是一个例子。很多企业用户都表示,相比于数据规模巨大,数据类型多样化其实是大数据时代更大的挑战。TechTarget记者针对非结构化数据问题,采访了美国信息治理公司Yankee Systems首席咨询师Anne Marie Smith。
TechTarget:“大数据”从字面上看似乎更强调数据规模巨大,您怎么看待“大数据”这个概念?
Anne Marie Smith:大数据应用因公司而异,大数据究竟指什么取决于你是什么样的企业、你的企业打算怎么利用数据。经过七八年的发展,大数据的含义不断变化,不断丰富。我认为说到数据类型也不能只说非结构化数据,其实大数据包含所有过去记录式文件系统不能处理的数据。
比如word文档、电子邮件,包括您今天进行的采访,都是传统纪录式数据系统不能处理的。但现在,随着存储能力的增长,这些数据集体爆发了出来。
因此,大数据不仅仅是数据规模的增长,它包含了更多的东西。大数据就像一个藏得很深的宝藏:不挖下去永远不会发现。现在很多企业在进行数据挖掘,至于能挖掘出什么,其实它们也不知道。
TechTarget:您认为企业的非结构化数据治理出于什么阶段?非结构化数据治理主要的困难是什么?
Smith: 很多企业的结构化数据治理还没有开始。它们没有把数据看成和资金和产品一样实实在在的企业资产。不过可喜的是,企业正在逐渐认识到数据的价值,陆续开展数据治理工作。
但是我敢说,在所有开展结构化数据治理工作的企业中,只有1%,甚至不到1%的企业在开展非结构化数据治理工作。原因是多种多样的。
很多企业的结构化数据还没有处理好,怎么会再花时间去处理自己都不太理解的所谓非结构化数据?即便是企业的结构化数据处理的很好,但是把结构化数据的应用迁移到非结构化数据上也是一个难题,因为结构化数据往往让企业不知从何着手。
企业还没有采取行动的原因之一在于它们还没有明确定义非结构化数据。有人认为对非结构化数据的治理要毕其功于一役,要么什么都不做,要做就要全面治理所有非结构化数据。这是最要不得的。非结构化数据类型多样,治理工作也要逐渐开展。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
关于如何选择混合云,你不得不知的几件事
近年来,提升云计算能力一直是IT决策者和企业对于未来规划的着重点,随着云计算的不断发展,混合云渐渐成为关键词。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
Tableau 携手神州数码 推进中国商业分析发展进程
为了帮助商业领域的更多从业者使用数据,在更短的时间内做出更好的决策,可视化分析领域的Tableau Software今天宣布与神州数码集团建立合作伙伴关系,在中国的商业分析进程中展开深度合作。