数据库领域初创公司Splice Machine上周宣布,发布SQL-on-Hadoop数据库,官方宣称它可以在HDFS(Hadoop分布式文件系统)中运行SQL查询和ACID事务。
Splice Machine公司总部位于旧金山,去年五月推出该产品的公测版,此次推出1.0版本。作为产品的一部分,Splice Machine部署了修改版的开源Apache Derby,它是轻量级的基于Java的关系型数据库,安装在HDFS或HBase NoSQL数据库上。Derby支持SQL能力,HBase支持Hadoop集群中跨服务器的数据库表的扩展。
Splice Machine联合创始人兼CEO Monte Zweben表示,公司致力于提供通用平台,处理多种事务和分析程序,而不是像其他初创数据库供应商一样专注于某个数据处理领域。在Hadoop上运行软件,可以以低成本进行扩展,对SQL和ACID ——原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)——的支持符合大多数企业使用关系型数据库的习惯。
Hadoop+RDBMS
市场服务咨询公司Harte Hanks产品创新管理总监Rob Fuller认为,通用数据库即意味着混合数据库,既能满足交易性需求,又能满足分析性需求。Fuller使用过Splice Machine软件的公测版,他很看好这种将Hadoop和关系型数据库结合起来的形式。
Fuller表示:“在Hadoop上实现实时事务处理是现在的技术热点。Harte Hanks此前部署了Oracle RAC集群,但还是在寻找更好的分析性能和扩展性能。在测试阶段,Splice Machine软件在处理超过8亿行数据的表查询中表现良好,其查询速度是Oracle RAC数据库的三到七倍。并且,用scale-out的形式在Hadoop集群中增加更多的服务器,会收货更好的性能。
Hadoop上第一个纯粹的通用型数据库
IDC分析师Carl Olofson认为,Splice Machine想要展示给人们的是支持交易型查询的数据仓库平台。他认为Hadoop数据库架构的扩展性为它增色不少。开源软件的采用和对商业集群的支持让它在成本上颇具优势。
咨询集团Bloor首席分析师Robin Bloor认为,Splice Machine的方法可能最接近于在Hadoop上运行Oracle数据库。Bloor评价该产品为“Hadoop上第一个纯粹的通用型数据库”,同时它也高度评价了Splice Machine为优化Berby数据库做出的贡献。
从某种程度上来讲,Splice Machine数据库代表这Derby系统的回归。Derby在上世纪九十年代产生于Cloudscape公司,之后该公司被Informix收购,Informix又在2001年被IBM收购。IBM将Derby技术开源,将它贡献给Apache软件基金会。
Splice Machine目前提供两个版本:免费初创公司版本和企业版。初创公司版本针对成立不满五年,年收入在1千万美元一下的公司。企业版包括免费开发和测试节点许可证和付费许可证。许可证价格每年每节点5千美元起,包含所有支持服务。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
乘风破浪!拥抱数据洪流
全球产生的数据量达到惊人的地步,2013年生成的数据总量约为3.5 ZB。到2020年,保守估计,全球年数据量将达到44 ZB。企业该如何在大数据的时代取胜?
-
Dr. Elephant:Hadoop和Spark的优化“神器”
美国加州软件公司Pepperdata的应用程序分析软件建立在Dr. Elephant开源项目上。主要目的是让更多的Hadoop和Spark应用程序投入生产。
-
Spark和Hadoop分析遇障碍?可以试试容器啊
将定制的Spark和Hadoop试点项目转移到生产中是一项艰巨的任务,但容器技术缓解了这种艰难的过渡。
-
Teradata发布开源Kylo软件 实现数据管道快速搭建与管理
企业运用Teradata天睿公司推出的数据湖管理软件平台Kylo,能够更简单、更经济、更迅速地开发数据湖,并专注于实现显著业务成果。