飞机旅行似乎已快要达到很多乘客的忍耐极限——座位间距小、食物选择少、飞行时间长,还有就是安检的等待和催促。
旅行者们在经过主要枢纽机场的时候都已经做好了这样的心理准备。不过,他们有可能不知道,在每次飞行的背后,都有着大量数据的生成;只有对它们进行采集、挖掘、分析才能保证飞行安全。虽然大部分数据都是结构化数据,但是也有一部分是文本形式,来自撰写报告、音频录音和警示信号。
NASA首席数据科学家Ashok Srivastava说:“所有人都知道国家空域非常安全。”Srivastava是系统范围安全保险技术项目(SSAT)的牵头人,列举了1959到2006年每年的死亡事故率,来证明近五十年间这一比率的稳固下滑趋势。
“但现在的问题是,在不断增加的航班数量中,怎样才能让航行变得更安全一些?”
在今年夏天第八届年度文本分析峰会(Text Analytics Summit)的演讲中,Srivastava提到,每年的航班增长率可达2%到3%,根据具体经济情况上下波动。而交通统计局(Bureau of Transportation Statistics)的报告显示,美国交通部仅在2011年一年中就记录了1000万次国内和国际商业航班。如果增长率为2%,那就是说每年都有几十万次新的航班开通,给空域加压。
他说:“如果是这样的情况,我们只有寻找到提高安全性的方式,才能保持低事故率。这是一个NASA和其他机构目前正在努力的领域,关键就在于必须大力控制住风险。”
通过文本分析得出事件原因
Srivastava和他的团队会仔细分析发生的异常事故,其中一个方法就是在地图上按照连续性把它们标识出来,通常从一个安全的州开始。而对于那些在连续性中“反常的州”,团队会特别注意,因为这意味着事有蹊跷、值得警惕;他们会在这样的地方上做下记号,提示该路线安全系数低,可选择回航到安全的州。
“文本在理解事件中所扮演的角色越来越重要。”
团队对运营数据进行分析,识别在反常的州发生的事件,同时也会参考机组和地勤工作人员的报告。Srivastava称,这些报告能够帮助他们理解事件发生的随机因素和实际原因。
在金融业中,按秒以计的数字数据可以显示股票走势,而媒体报告能够解析数字之外股票涨跌的原因。航空报告也是这样。
“单凭数字数据本身,我们没办法分析出事故的原因。”
Srivastava举出实例,大概一年多以前,肯尼迪国际机场发生了一次事故,埃及航空公司的986次航班和德国汉莎航空公司的411次航班在跑道上差点发生碰撞,还好没有酿成惨剧。
“请问这次事故为什么会发生?是怎么回事?我们又怎样对这次数据进行分析?”对此,他们展开了调查,包括分析飞行员与控制塔之间的音频录音,后来得知是埃及航空公司的航班转错了弯。NASA还处在音频分析的初级阶段,即将录音转制为文本内容。
搞清楚了是怎么一回事之后,Srivastava和他的团队着眼于从随机因素中提取出预测信息,以防止未来类似事故的发生。
他说:“这对今天的系统安全来讲至关重要,对明天的系统更是如此。”
从分析走向预测
在数据分析流程中有一种传统的方法,即单独分析数字数据和文本数据,然后再把它们整合到一起,得出结论。
Srivastava说:“很多人都在采用这种方式,我认为很有效,但是我们的做法完全不同。”
他们把数据汇集到同一个系统,对所有数据一并分析,包括雷达和卫星系统中的网络数据、软件中的航空数据、引擎和传感器数据、地勤和机组人员的地面文本数据等等。分析在单一架构中通过一级支持无线电导航(一种学习模型、检测模式的机器)完成。
他说:“通过短时间内把所有数据汇集到一起、进行同时分析,我们能够对诸如航空系统这样的真实系统进行高精确度预测。”
数据和文本一样,都可以通过不同的途径、运用多样化的方式进行分析,比如算法式和可视化;这使得NASA和其他机构能够密切关注流行趋势、事件的增幅减幅以及跑道入侵事故的因素。
Srivastava提及了企业在发展自己和规避风险时所采取的主动立场:就像企业社区一样,NASA和其他机构正在尝试着各种臆测、策略和技术,以期能够将问题在发生之前就扼杀在摇篮之中。
“而整个系统的命运都将由数据分析来决定。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
Nicole Laskowski is a senior news writer for SearchCIO.com and SearchCIO-Midmarket.com. She covers CIO strategies for analytics, business intelligence and data management. Prior to joining TechTarget, she worked as the news editor for a community newspaper in Arlington, Mass., overseeing the news content of both the weekly print publication and the newspaper’s website. Nicole also has worked for two other community newspapers in Oregon and Michigan and brings 10 years of writing and editing expe
翻译
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
乘风破浪!拥抱数据洪流
全球产生的数据量达到惊人的地步,2013年生成的数据总量约为3.5 ZB。到2020年,保守估计,全球年数据量将达到44 ZB。企业该如何在大数据的时代取胜?
-
【2017 Teradata大数据峰会直击】Teradata专注提升数据分析能力,致力挖掘客户业务价值
数据分析解决方案供应商Teradata天睿公司今日(2017年5月19日)在上海举办2017 Teradata大数据峰会。