大数据在改变数据环境的同时,也带来深刻的技术变革。大数据时代催生了NoSQL数据库、Hadoop分布式存储等新兴技术。新技术发展迅猛,业内对它的看法也各有不同、莫衷一是。有人认为RDBMS(关系型数据库管理系统)将死,NoSQL为王;有人讥讽Hadoop只是简单的存储系统;当然更多人还是持折衷的观点,即新老技术会共同发展、优势互补。但传统技术和新兴技术如何落地部署,还是一个难题。
在刚刚结束的IBM 2014 技术峰会上,TechTarget中国记者就这一问题采访了IBM数据库专家。
IBM中国开发中心信息管理总经理朱辉认为:“Hadoop和NoSQL是我们这个时代里重要的技术演变,是技术上的创新,我们需要这种创新。”朱辉在软件行业有近二十年的工作经验,长期致力于DB2和Informix数据库的软件研发工作。早在2008年,他就带领一个团队关注Hadoop的开源代码,那时离Hadoop项目确立还不到两年。
IBM中国开发中心信息管理总经理朱辉
朱辉讲到,从应用角度来讲,我们并不一定依赖于传统的数据,数据存储也不需要存储在硬盘上,我们有新的数据类型出现,很多非结构化数据、半结构化数据本身在它们的形态上发生着变化。随着数据量的增加以及运算量的增加,我们也不可能用Scale-up的架构来交付这么大量的计算。
大数据本质:企业主业务系统向外延伸
但同时朱辉也强调:“我们也不认为大数据仅仅等于Hadoop,大数据的时代只能有NoSQL。”他认为大数据最后其实是以前的或者将来的主业务系统以及主业务系统当中数据的一个往外延伸,这个延伸纳入了更多以前没有的非结构化、半结构化数据。企业关心的并不是数据,而是如何从数据中获取更大的价值。
有意思的是,企业领导者并不像我们想象的那样关心技术本身。CEO不会执着于关系型数据库、也不会执着于非关系型数据库,他只要业务价值。企业未来一定需要更多的数据源进行分析,未来的大数据平台一定会融合更多的技术类型。
“兼容并包”的混搭平台
IBM数据库和数据仓库业务副总裁Sean Poulley介绍到,企业正在利用新技术构建自己的数据架构,希望把所有的数据都放入其中,将数据分为以下五个区域:
- 数据摄取区域:把信息进行存储为了进行日后其他的交易。
- 准备和探索区域:存储你不知道如何处理和运用的数据。
- 传统的企业仓库和数据市场:用于数据分析。
- 流数据区域:这个数据量非常大,需要利用内存技术根据数据做出实时决策。
- 深度分析区域:用来承载深度的数据挖掘、预测分析、语义分析等应用。
IBM数据库和数据仓库业务副总裁Sean Poulley
在谈到未来大数据平台发展的时候,朱辉特别强调“混搭平台”,混搭(mix)也是此次IBM 技术峰会的关键词。朱辉认为:“大数据平台的将来会是一个关系型数据库,非关系型数据库混搭在一起,中间又有非常强大数据整合、数据清洗、数据生命周期管理的工具,包括ETL工具,混合在一块儿形成的混搭的群组。”
无疑,混搭平台彰显了IBM的技术优势。IBM既利用了开源Hadoop技术,提供大数据分析工具BigInsights,又有老牌关系型数据库DB2,还有中间数据的转换、移动、整合、清洗这一系列的工具。所以朱辉声称:“我们拥有最完整的平台,使得我们最适合去搭一个混搭的大数据平台。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
相关推荐
-
【IBM观察文章】人工智能如何重新定义计算系统与架构
人工智能时代的到来,使得数据及计算能力的重要性再次升级,以往x86架构下以CPU为核心的计算性能提升到达瓶颈,呼唤计算力的重构。
-
乘风破浪!拥抱数据洪流
全球产生的数据量达到惊人的地步,2013年生成的数据总量约为3.5 ZB。到2020年,保守估计,全球年数据量将达到44 ZB。企业该如何在大数据的时代取胜?
-
Dr. Elephant:Hadoop和Spark的优化“神器”
美国加州软件公司Pepperdata的应用程序分析软件建立在Dr. Elephant开源项目上。主要目的是让更多的Hadoop和Spark应用程序投入生产。
-
供电创新:Enedis如何为法国95%的地方供电?
将分析和数据交到工人手中(字面上)改变了Enedis的文化。最近,他们为员工部署了10000多个现场平板电脑和智能手机,并开发了一个内部应用商店。