想必数据管理专家都很熟悉大数据的三个V——volume(规模大)、velocity(速度快) 和variety(种类多)。但是随着各种类型的数据库处理大规模数据流的技术愈加成熟,数据的种类逐渐成为大数据最棘手的问题。
Scotts Miracle-Gro公司商务智能项目的高级总监David Judson出席了SAS高级商业领袖系列会议,在他2011年接受大数据项目的时候,他并不担心数据库需要处理的数据的规模和速度,因为现存基础设施足以胜任。
他关心的是数据种类。Judson发现,每当他想要建立客户档案的时候,他得到的关于潜在客户的数据都是一些天气预报、聊天记录和其他形式的线上内容。这种问题现在也困扰着他。这种数据中得出来的信息结果无法以合适的格式进行存储或分析。
Judson表示,公司以前有一个企业数据仓库(EDW),但目前正在考虑如何使用Hadoop存储和分析混合媒体数据。
这不禁让我们重新审视“大数据”这个概念。因为“大数据”主要强调数据集规模的庞大。但事实上,处理大规模数据集时,面临的主要问题是如何处理不同类型的数据。
美国波特兰数据分析国际研究所的联合创始人、调查总监Tom Davenport表示大多数大型企业关心的都是数据种类。他最近完成了一份名为《大企业的大数据》的调查报告。通用电气、UPS和花旗银行等大企业都参与了调查。Davenport表示,这些公司主要关心的都不是数据量和处理速度。
Davenport认为,这说明人们通常理解的“大数据”并没有触及问题的关键。它没有充分的揭示出公司在部署大数据技术时应该考虑的因素。Davenport觉得会有一个表意更明确的词最终取代“大数据”这个词,只是现在还不知道它是什么。
Davenport表示:“种类是要考虑的首要因素。”
Jill Dyche是SAS研究院最佳实践的副总裁,同时也与Davenport合作开展了上述调研。她认为,当人们刚接触大规模数据集的时候,人们使用三个V来阐释大数据,想要广泛地定义这个新技术。但现在这个词已经失去其意义。不过要想用一个更能揭示大规模数据集本质困难的词替换它,恐怕还需要一段时间。
Dyche同时也表示,在另一方面,“大数据”这个词或许还值得沿用一段时间,因为它可以激起管理层的兴趣。或许他们并不知道“大数据”到底是什么,但他们会经常在杂志或其他地方看到它,从而最终选择它。
Dyche表示:“我觉得管理者关心数据只是一件很偶然的事,他们可能一下子就转变观念,决定采用‘大数据’技术。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
关于如何选择混合云,你不得不知的几件事
近年来,提升云计算能力一直是IT决策者和企业对于未来规划的着重点,随着云计算的不断发展,混合云渐渐成为关键词。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
Tableau 携手神州数码 推进中国商业分析发展进程
为了帮助商业领域的更多从业者使用数据,在更短的时间内做出更好的决策,可视化分析领域的Tableau Software今天宣布与神州数码集团建立合作伙伴关系,在中国的商业分析进程中展开深度合作。