TechTarget首席业务分析师Wayne Eckerson称,开源分布式技术Hadoop目前仍然是大数据的代名词。而目前最主要的挑战就是Hadoop远没有传统企业数据系统相关技术成熟,IT采购人员需对这一点提起注意。
虽然存在一些问题,但是Eckerson认为,在收集、管理和分析多种非结构化数据的时候,Hadoop仍然是大数据系统的首选方案。Hadoop集群提供了一个存储非结构化和半结构化数据的平台,这个功能是传统数据仓库环境所无法实现的。此外,Hadoop分布式文件系统(HDFS)同企业数据仓库相比,能够使用户更加快速地处理和应对大数据。
“你无须预先对数据进行建模,也免去了映射、转换和加载的过程。” Eckerson说:“你只需直接访问Hadoop文件系统就可以了。”
然而,这并不是说Hadoop系统能够当做分析应用的“万金油”,面对某些特定的场景,基于批处理环境的Hadoop也并不适合,比如“迭代,快速查询等”。Eckerson表示,绝大多数用户在部署Hadoop之后就可以迅速看到效果,原来一些没有用到的信息也都得到了充分利用。
在本期的播客中,Eckerson将围绕Hadoop与大数据话题进行讨论,您将看到以下一些议题:
- 大数据定义(0:15)
- 现有BI与数据仓库环境的大数据现状(0:52)
- 使用Hadoop的优势(1:45)
- 企业在部署Hadoop时所面临的挑战(2:55)
- 部署Hadoop时需要注意的一些问题(3:54)
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
关于如何选择混合云,你不得不知的几件事
近年来,提升云计算能力一直是IT决策者和企业对于未来规划的着重点,随着云计算的不断发展,混合云渐渐成为关键词。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
乘风破浪!拥抱数据洪流
全球产生的数据量达到惊人的地步,2013年生成的数据总量约为3.5 ZB。到2020年,保守估计,全球年数据量将达到44 ZB。企业该如何在大数据的时代取胜?