大数据预测分析(Big Data Predictive Analytics)可谓是大数据的圣杯,也是众多数据分析人士的终极梦想。谁不想帮助企业做出英明的业务决策、卖出更多商品和服务、让客户更开心同时避免灾难的发生呢?但是预测分析同时也是一个极端困难的任务,实施成功的预测分析有赖于以下四大关键因素:
一、数据质量。数据是预测分析的血液。数据通常来自内部数据如客户交易数据和生产数据。但我们还需要补充外部数据源,如行业市场数据、社交网络数据和其他统计数据。与流行的技术观点不同,这些外部数据未必一定是“大数据”。数据中的变量是否有助于有效预测才是关键所在。总之,你手里的数据越多,相关度和质量越高,你找出原因和结果的可能性越大。
二、数据科学家。数据科学家必须理解业务需求和业务目标,审视数据,并围绕业务目标建立预测分析规则,例如如何增加电子商务的销售额、保持生产线的正常运转、防止库存短缺等。数据科学家需要拥有数学、统计学等多个领域的知识。看看2008年Netflix大奖(点击查看获奖算法)得主——Formulas Galore(2006年开始,在线电影租赁公司Netflix用百万美元悬赏,奖励能够将其电影推荐算法准确性提高至少10%的人。),那才是真正的科学。幸运的是,大多数预测分析解决方案要求没有这么高。
三、预测分析软件。数据科学家必须借助预测分析软件来评估他们的分析模型和规则,预测分析软件通过整合统计分析和机器学习算法发挥作用。IBM SPSS和SAS是两个数据科学家常用的分析软件。R项目则是一个非常流行的开源工具。如果数据量大到“大数据”的程度,那么你可能还需要一些专门的大数据处理平台如Hadoop或数据库分析机如Oracle Exadata。
四、运营软件。如果你很幸运找到了合适的预测规则,下一步就是将规则植入你的应用。你的预测分析软件应该能以某种方式产生代码,例如预测分析厂商KXEN的产品。更重要的是将预测规则需要的数据事先准备好。预测规则也能通过业务规则管理系统和复杂事件处理平台(CEP)进行优化。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
关于如何选择混合云,你不得不知的几件事
近年来,提升云计算能力一直是IT决策者和企业对于未来规划的着重点,随着云计算的不断发展,混合云渐渐成为关键词。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
Tableau 携手神州数码 推进中国商业分析发展进程
为了帮助商业领域的更多从业者使用数据,在更短的时间内做出更好的决策,可视化分析领域的Tableau Software今天宣布与神州数码集团建立合作伙伴关系,在中国的商业分析进程中展开深度合作。