Hadoop受到很多人的关注,但是大数据框架融入IT主流的步伐在减缓, Gartner公司2015年的调查显示只有十分之一的受访者将Hadoop用于生产应用。其中一项限制因素是:在其配套运行环境MapReduce中的编程复杂性。但是,新兴的SQL-on-Hadoop查询引擎为Hadoop的更广泛使用提供了新的便利。
关于SQL-on-Hadoop工具,有以下三个要点应注意:
SQL编程人员是营救Hadoop的骑兵。到目前为止,Hadoop很大程度上都依托于由掌握高级技能的程序员用java编写的MapReduce程序。但是,具备这种高级技能的程序员远不够多,而且雇佣和保留这些高级人才的成本也很高。SQL是关系数据库的标准编程语言,如果把Hadoop与SQL实现了整合,就相当于对所有开发大军和数据分析师都开放了Hadoop的使用,大多数组织都有很多熟练掌握SQL技术的人员。
批处理作业不再是唯一的用法。MapReduce只支持按预定义的时间表批量处理任务。一些SQL-on-Hadoop引擎也支持批处理,不过也有一些支持交互式的临时查询,这样就可以使用主流商业智能BI工具。工具可以帮助支持用户针对Hadoop集群中的数据做自服务BI和实时分析。
现在业界出现了很多SQL-on-Hadoop方案可供选择。大概有十几种SQL-on-Hadoop工具可以用,有的是开源的,也有一些是商业产品。这个产品队伍还在持续壮大。这些产品大部分仍不成熟,一些产品只支持部分SQL功能。因为这些产品针对于不同应用程序设计,所以关注这方面产品的用户在选择使用产品之前需要理解他们的最优使用场景。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
TechTarget特邀编辑。2003年入软件行业,熟悉软件过程所有环节,对机构信息化的各方面有深入理解和实践经验。现就职于某互联网创业公司,目前关注互联网分布式系统架构和机器学习。喜欢传统文化社科哲学(尤喜《周易》、《老子》),喜健身喜抓举(具备抱人引体向上的能力),喜欢中国象棋(具备盲棋1对2的能力)。
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
关于如何选择混合云,你不得不知的几件事
近年来,提升云计算能力一直是IT决策者和企业对于未来规划的着重点,随着云计算的不断发展,混合云渐渐成为关键词。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
Tableau 携手神州数码 推进中国商业分析发展进程
为了帮助商业领域的更多从业者使用数据,在更短的时间内做出更好的决策,可视化分析领域的Tableau Software今天宣布与神州数码集团建立合作伙伴关系,在中国的商业分析进程中展开深度合作。