数字媒体软件供应商Adobe公司运用SAP Data Service将Hadoop数据加载到SAP内存数据库HANA上。那么,你的企业应用Hadoop进行数据管理的业务用例是什么样的呢?为什么任何一个数据项目,尤其是Hadoop项目一定要有专门的业务用例呢?
Adobe公司高级数据仓库工程师Kevin Davis表示,我们之所以使用Hadoop,是因为我们的数据量巨大。Hadoop组件能够追踪所有Adobe Creative Cloud上发生的事件。我们有250万付费用户,和120到150万免费用户。这些用户在Adobe Creative Cloud上的所有操作都以数据流的形式存入到Hadoop系统中。我想,这就是人们所说的大数据了。
Davis表示,最初决定部署hadoop时,我并没有参与讨论。不过事实证明,在处理大规模数据集和海量事件上,Hadoop的确表现优异。
为Hadoop制定业务用例是很重要的,因为Hadoop是比较难的技术,将Hadoop与HANA这样的分析引擎集成也不容易。更多的人还是习惯使用传统的关系型数据库。应用Hadoop还需要对人员进行培训,相比之下,应用传统关系型数据库就要容易的多。另外,很多技术人员都有操作Oracle的经验和操作SQL Server的经验,如果组织需要补充的资源,可以很容易地聘请熟悉Oracle和SQL Server的人,但要寻找有丰富Hadoop经验,又熟悉Hadoop与HANA集成的人就困难多了
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
乘风破浪!拥抱数据洪流
全球产生的数据量达到惊人的地步,2013年生成的数据总量约为3.5 ZB。到2020年,保守估计,全球年数据量将达到44 ZB。企业该如何在大数据的时代取胜?
-
Dr. Elephant:Hadoop和Spark的优化“神器”
美国加州软件公司Pepperdata的应用程序分析软件建立在Dr. Elephant开源项目上。主要目的是让更多的Hadoop和Spark应用程序投入生产。
-
Spark和Hadoop分析遇障碍?可以试试容器啊
将定制的Spark和Hadoop试点项目转移到生产中是一项艰巨的任务,但容器技术缓解了这种艰难的过渡。
-
Teradata发布开源Kylo软件 实现数据管道快速搭建与管理
企业运用Teradata天睿公司推出的数据湖管理软件平台Kylo,能够更简单、更经济、更迅速地开发数据湖,并专注于实现显著业务成果。