分析数据(从汇总到数据挖掘)能够深入分析业务内涵。分析不仅可用于发现趋势,预报未来事件,还可用于填补信息缺失点,发现因果关系,为组织决策者提供决策所需要的最佳数据。 因此,数据仓库应该提供多个存储数据的位置,组织和建立数据结构,抽象和优化信息。大型数据仓库能够为这种分析数据的类型提供坚实的分析基础。
全范围业务数据 在数据集合中查找重要趋势和信息需要整套数据。数据越全面和详细,分析就越精准。这意味着,需要保存更多的在线系统数据,为分析系统提供更丰富的数据源。此外,这也意味着保存更多来源的统一数据可以扩大分析范围。
我曾经处理过许多保存详细数据的系统。在数据容量较大的情况中,这是……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
分析数据(从汇总到数据挖掘)能够深入分析业务内涵。分析不仅可用于发现趋势,预报未来事件,还可用于填补信息缺失点,发现因果关系,为组织决策者提供决策所需要的最佳数据。
因此,数据仓库应该提供多个存储数据的位置,组织和建立数据结构,抽象和优化信息。大型数据仓库能够为这种分析数据的类型提供坚实的分析基础。
全范围业务数据
在数据集合中查找重要趋势和信息需要整套数据。数据越全面和详细,分析就越精准。这意味着,需要保存更多的在线系统数据,为分析系统提供更丰富的数据源。此外,这也意味着保存更多来源的统一数据可以扩大分析范围。
我曾经处理过许多保存详细数据的系统。在数据容量较大的情况中,这是常用的做法。一旦对数据进行了汇总,就不需要再保存全部的详细数据。通常,因为系统本身无法处理很大的数据容量,所以详细数据会被删除,高级汇总数据会被保留。然而,如果需要进行数据挖掘,则需要保留这些详细数据,来创建和培训挖掘模型。我处理的系统都保留了一年或两年的详细数据,必须人工从存档中对它们进行恢复。否则,两年前的详细数据无法使用。系统处理大容量数据的能力反映了它所能执行的分析类型。
说明:假设要为零售商设计一个系统,它需要预测季节性产品的市场趋势,并直接关系到具体的宣传推广活动。虽然有一些部门汇总的产品销售数据可用,但为了帮助零售商生成可用于指导销售计划的特殊报表,系统必须存储最近三年的详细信息。因为需要大量的空间,系统无法在线保存这些信息。即使这个系统存档了所有详细数据,其他系统无法存档,整个数据分析过程也无法进行。由于物理架构限制了他们的决策过程,这样的设计不能完全满足企业需求。
企业数据通常受多种外部因素的影响。外部事件可能会对业务内部的数据产生重大影响,如股票市场趋势、天气情况和商品市场变动等。如果数据仓库有足够保存数据的容量(包括对数据的存储、处理、整合与优化),那么它就可以带来真正的商业价值。相反,如果系统的容量已经接近饱和,那么就不可能再增加这些数据了。
存储大量数据的能力仅仅是一方面。支持数据分析的大型数据仓库系统还需要具备足够的处理能力,在回应用户请求的同时,汇总数据、建立挖掘模型。因此,这些系统执行并发操作的规模大小也值得认真考量,例如,在安全查询数据时加载数据。能够解决这些问题的系统也就能够实现更大的商业价值。
许多组织需要混合使用大量的汇总数据、明细数据和事务数据。汇总数据通常可以确定一小部分验证预期行为的事务或反映组织问题的数据。如果系统能够深入分析明细数据,帮助分析师分辨正确与错误,那么这个系统将有助于企业作出更明智的决策。
再次强调,这会有利于确定大型数据仓库的需求。它不仅需要处理大容量数据,还必须拥有快速加载数据和保持用户响应速度的能力。它必须提供足够详细的事务数据结构、汇总结构和数据挖掘结构,帮助分析师获得一些重要结果。
作者
翻译
TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
乘风破浪!拥抱数据洪流
全球产生的数据量达到惊人的地步,2013年生成的数据总量约为3.5 ZB。到2020年,保守估计,全球年数据量将达到44 ZB。企业该如何在大数据的时代取胜?
-
【2017 Teradata大数据峰会直击】Teradata专注提升数据分析能力,致力挖掘客户业务价值
数据分析解决方案供应商Teradata天睿公司今日(2017年5月19日)在上海举办2017 Teradata大数据峰会。