观点丨关于大数据的问答

来源: 中国社会科学报

发布日期: 2014-06-20 13:48:27

本文通过问答形式探讨了大数据的本质、作用及其在社会发展中的重要性,强调了大数据作为知业社会核心资源的潜力和挑战,并提出了对大数据负面作用的思考和防范建议。

当前,“大数据”在业界和学界已成为“时尚”话题,人们认为“人类已进入大数据时代”,并赋予“大数据”之于经济社会发展的作用以“革命性意义”。“大数据”究竟有什么用?一部分人认为“大数据”无所不能;也有人认为,“大数据”作用的发挥,依赖于数据收集、数据提纯、数据判断等多重关键要素,且数据有时候也会骗人。基于此,有学者指出,大数据“是一个过度包装的概念”,是个伪命题。

您认为,大数据到底是“真命题”还是“伪命题”?为什么?

追求“时尚”是人类天性的一部分,“大数据”以“时尚”话题的形式风靡全球业界和学界,不见得是什么坏事,也无须过渡关注非议,关键是要认清问题的本质。

对我而言,问题的本质就是继农业社会和工业社会的发展阶段之后,人类社会正在起步迈向一个崭新的“知业社会”,其核心内容就是信息和智力的大开发,就像农业社会之表征是地表资源土地的大开发、工业社会之表征是地下资源矿藏的大开发一样,所谓“大数据”就是知业社会起步阶段在当下的一个“时尚”符号而已。

基于这一认识,“大数据”在本质上是一个“真命题”,而且“大数据”之于经济社会发展也确实具有“革命性意义”,就像工业相对农业对人类经济社会的发展具有革命性的作用一样。

但是,“大数据”根本不可能具有“无所不能”的功能!道理十分简单,连“革命”本身都做不到“无所不能”,何况其中的一个阶段性的“大数据”?

“大数据”或许能以更加公开、公平、公正的方式转移社会发展的主要矛盾和焦点,就像工业革命并没有完全解决农业社会的问题,但却以更加文明和进步的方式提出社会发展的新问题和新方向。

更有可能的是,不要多久,会有新的更加时髦的术语及话题取代“大数据”,这是人性对“时尚”的“刚性”需求,然而问题之本质在很长的阶段不会改变:人类社会的生存与发展之主要矛盾终于脱离了土地,我们正进入以信息和智力资源大开发为表征的“知业社会”。这是人类实现和谐可持续发展的必然之道,数据,不管“大”还是“小”,就是这一崭新的“知业社会”赖以生存和成长的“矿藏”。

然而,矿藏需要开发、处理之后才能利用,必须有针对数据的“炼钢厂”、“炼油厂”等,但前提首先要认识其价值。回顾历史,各种自然矿藏在工业社会之前就存在,但几百年前的农业社会里,除了金银铜铁之外,人们对于散落在山坡上的煤块、飘浮在河溪上的石油,几乎是视而无睹,甚至当杂物除之,利用也是“小打小闹”。除了技术上原因,更主要的,是认识上的问题,甚至是“想象”上的问题。

客观上,数据早已存在于自然世界和人类社会的各项活动之中,但过去我们没有认清其价值并缺乏收集、处理、利用它们的技术和手段;以至除了数据中的“金银铜铁”之外,对于其它“广大的小数据”们,差不多也是视而无睹,最多不过“小打小闹”的利用一下而已。

今天,我们必须清醒地认识到,不管你支持还是反对“大数据”这一“时尚”话题,就像工业革命依靠自然矿藏一样,即将到来的“知业革命”和“知业社会”,必须建立在“数据矿藏”的充分和深度地开发、处理和利用之上。

在此,我希望重申一下认识问题的重要意义。

许多人或许不认同科学哲学家波谱尔关于整个世界是由物理、心理、人工三个世界组成的观点,但客观上,人类至今的产业发展历程就是农业社会在地表层面上开发了自然的物理世界;工业社会通过文艺复兴在心理世界解放了人类,诱发了科学知识的革命,进而从地下到太空对物理世界进行了深度开发;“知业革命”,就是利用自然矿藏之外的信息与智力“矿藏”,进行第三“人工世界”的大开发,进而回头更加深度地开发第一和第二的物理与心理世界,实现三个世界的和谐生存与可持续发展。

我们没有机会及早认识到文艺复兴对于工业革命的意义,结果由世界上曾经的发达国家迅速沦为任人宰割的半殖民地。希望惨痛的历史教训,使我们这一次能够认清基于“数据矿藏”的信息与智力资源对于“知业革命”的意义,从物联网、大数据、云计算到知识自动化、社会计算、智慧社会,扎扎实实地进行数据收集、数据提纯、数据解析、数据利用等等,使我们真正成为智力上的世界强国,借机实现中华民族复兴的“中国梦”。

总之一句话:我们必须以重视和利用矿藏的方式,重视和利用数据!

的确,眼下“大数据”已经被过度包装。“大数据”时尚,但非万能,不必事事时时相连。正如时装的本质是为了推动健康文明,但不可时时人人时装,特别如果人人都成了时装演员,就更荒唐了。凡事有度,我认为“过度包装”只是短暂的“超调”现象而已,只要“大数据”不被炒成“大跃进”,不必过虑。

相对于视大数据本身为“伪命题”,我更倾向于认为“大数据的负面作用”是一个“伪命题”,因为大家都知道科技本来就是一支双刃剑,关键是谁用和如何用。但此时讨论“大数据的负面作用”确实有意义,特别是在国外刚就谷歌等在大数据应用中的一些失败展开了“大数据:大错误?”反思之后。我个人最关注的是在微信、微博等社会大数据之下如何保护个人隐私的问题,还有如何防止大数据的大规模应用失误可能造成“大错误”的问题。

个人隐私保护急需相关的立法,在保障合法权利之下,防止有人利用大数据技术进行人身攻击。例如,美国许多州已经或正在立法,禁止“Revenge Porn(报复性不雅照片)”行为,即失恋或关系结束后将原朋友的私密照投放社会媒体等现象,曾经常发在青少年之中。至于如何有效避免大数据大错误的发生,不妨借鉴上世纪九十年代由于无节制的计算机交易多次促成并加剧股市崩盘之后,有关国家对快速大量自动交易所采取的一些措施。

不过,我更担心的是不及时有效地开发、处理、利用“大数据”可能造成的负面作用甚至国家风险。从农业到工业时代,自然中许多物理反应过程在现代企业环境中变的更加复杂、强大、危险,由此催生了基于实时物理信号的自动化产业,因为如果还是按农业时代的“自然”方式处理这些过程,就会在生产中发生许多爆炸灾难。

现在,我们正从工业走向知业时代,社会中的许多组织过程在网络环境中也变得更加动态复杂,“大数据”实际上揭示了实时“社会信号”的到来,也必将催发未来的新型社会管理产业。知识自动化、社会及文化资源规划SRP和CRP等系统只是滥觞,我们必须尽快利用大数据,特别是以微信微博为代表的社会信号,创新社会管理,开发出各种各样的社会管理和服务系统。

否则,就像工业生产没有自动化就不能提高产能且容易产生事故,不利于新型社会管理和服务系统及时处理,甚至无视社会信号,也可能在社会过程中产生许多“爆炸”,危害社会的健康发展。

实际上,十九世纪法国科学家安培提出控制论一词的原意就是科学地进行国务与社会事务的管理,只是当时还没有大数据和社会信号,但已经有了工业生产中的物理信号,因此只能把控制论思想用于工业控制,使工业社会得以实现。

今天,网络技术、信息理论、智能系统已经把大数据和社会信号洪水般地推向几乎每个人的面前,“堵”已太晚也根本不可能,我们必须尽快将其作为“矿藏”加以认识利用,创新社会和经济管理,实现“知业革命”,从而更有效地服务人类,向更加开放,繁荣、公正的社会迈进。

UUID: 2c6cfdd3-dd61-43fc-adc4-357ea9e2edee

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院之声公众号-pdf2txt/2014/中科院之声_2014-06-20_观点丨关于大数据的问答.txt

是否为广告: 否

处理费用: 0.0064 元