大数据与马航MH370

作者: 唐常杰

来源: 唐常杰科学网博客

发布日期: 2014-04-19 02:04:00

文章讲述了一位九旬老人对大数据技术的理解过程,通过马航MH370失联事件的例子,解释了大数据的四大特点,并探讨了如果马航装备了MDSL(多通道数字同步记录仪),可能对搜寻MH370带来的影响。

一位经常看报但不会上网的离休长辈要我解释大数据技术,这位九旬老人还要求,用“咱们老百姓”能懂的大白话。于是,给老人先讲了云(计算)、物(联网),以及人(社会网络),再解释“云”如何为大数据准备了的支撑,而“物”和“人”为何既是数据消费者,也是数据的生产者,当十亿级的人和百亿级的传感器为大数据增砖添瓦时,大数据时代就到来了。

还说了大数据有四大特点,即:大(数据量大)、多(数据类型多)、快(要求处理快)、值(价值大而密度低)。

借用马航MH370的常识注意到老人天天看报,对马航MH370失联客机(也许,不久会改称为失事客机)的报道消息比较清楚,几十天来,老人为乘客惋惜,为乘客家属担忧,也因马航的不确切消息而愤怒,还为在前方搜寻的战士祝福.......关于马航MH370的报道已经在老人脑中形成了一个由相关概念和常识组成的语义网络,用行话描述,已建立了“本体”(可比喻为“说文解字”),观察到这一点,于是用大白话解释:大数据处理就是大海里捞黑盒子,就是大海捞针。

大海捞黑匣子,需要要大致知道“黑匣子”的大致方位。前些天,马航提供的不确切消息,忽悠着人们作了名副其实的南辕北辙,在北方通道上用了太多的冤枉力;这也解释了大数据处理的一个关键技术--智能地约简大数据,要求约简而不失数据核心。最近,马航把搜寻地点“约简”到相当于湖南省面积的大小,还需要以后的实践来检验,是不是包含了那个“核心数据集”。

可惜马航没有装备这个产品(或类似产品),可能有下列原因:(1)马来西亚现在还是英联邦成员,马航和英国航空工业界有千丝万缕的联系,不知是因崇英而“从”英,还是因“从”英而崇英,英国的航空产品和技术常是其首选;(2)大陆国家和海洋国家有区别,对产品有特殊要求;(3)缺钱;(4)中国产品的宣传不到位;酒好也怕巷子深;(5)国家关系和高端技术出口,需要交流或谈判,记得有一首歌唱道“爱情不是你想买,想买就能买”,把其中的“爱情”换为“高端技术”,或许能解释这一场景。

如果马航装备了MDSL,也许今天搜寻MH370就没有样困难。但历史没有“如果”,“向使当初身便死,一生真伪复谁知?”,那只存在于科幻的并行宇宙中或穿越小说中。

UUID: 21152d43-3fb2-44f1-acdf-fd5836b20462

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院之声公众号-pdf2txt/2014/中科院之声_2014-04-19_大数据与马航MH370.txt

是否为广告: 否

处理费用: 0.0040 元