软件公司Intuit和Novantas采用了特定的方法来部署他们的第一个Spark集群,限制了初始用户访问,并寻找更加坚实的业务用途。 Intuit公司已经建立了一对Spark集群,最初用于分析其网站的点击流记录以及其财务和会计软件的用户在线表单中输入的数据。但是Intuit的数据工程和分析团队副总裁Bill Loconzolo不打算使用开源数据处理引擎来处理事务。 Loconzolo说,Spark集群设置是实验性的,可供数据科学家在他的团队和一个单独的高级技术组使用。
直到2016年年底,他不打算开放系统实现更广泛的使用。 这与他在构建以Hadoop为中心的大数据分析架构时所采取的方法保持一致……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
软件公司Intuit和Novantas采用了特定的方法来部署他们的第一个Spark集群,限制了初始用户访问,并寻找更加坚实的业务用途。
Intuit公司已经建立了一对Spark集群,最初用于分析其网站的点击流记录以及其财务和会计软件的用户在线表单中输入的数据。但是Intuit的数据工程和分析团队副总裁Bill Loconzolo不打算使用开源数据处理引擎来处理事务。
Loconzolo说,Spark集群设置是实验性的,可供数据科学家在他的团队和一个单独的高级技术组使用。直到2016年年底,他不打算开放系统实现更广泛的使用。
这与他在构建以Hadoop为中心的大数据分析架构时所采取的方法保持一致。 Loconzolo说,他试图在试用模式下运行Spark等新技术至少六个月,以确保他们准备好了。
他解释说:“这是我们从过去几年经历过的教训与其他大数据技术的结合。有时,早期暴露给用户是最糟糕的事情。”
纽约Novantas公司的技术部门首席技术官和工程总监Kaushik Deka说,他们的团队在2015年中期开始使用Hadoop和Spark时,采用了循序渐进的策略。
“我们一年前从来没有使用大数据平台,”Deka说,“我们完全拥有这样的技术,但它是一个组织内真正的文化变革。”Novantas还不得不建立Spark等工具的内部专业知识培训体系,主要是通过对现有工人进行再培训。
为了避免出现问题,该公司为大数据技术找到可靠的初始业务。使用其分析服务和软件的银行之一要求帮助组合不同的数据集,以支持预测建模如何个别客户如何响应市场营销。Spark是一个很好的选择,实现提取,转换和加载数据集成。
Gartner分析师Nick Heudecker说,咨询公司正在从客户那里获得大量关于Spark的查询。但是技术还在逐渐成熟,很多企业正在密切关注是否实现技术的部署。
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
关于如何选择混合云,你不得不知的几件事
近年来,提升云计算能力一直是IT决策者和企业对于未来规划的着重点,随着云计算的不断发展,混合云渐渐成为关键词。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
Tableau 携手神州数码 推进中国商业分析发展进程
为了帮助商业领域的更多从业者使用数据,在更短的时间内做出更好的决策,可视化分析领域的Tableau Software今天宣布与神州数码集团建立合作伙伴关系,在中国的商业分析进程中展开深度合作。