不久前,美国普林斯顿大学教授、《知识分子》主编谢宇接受《严肃的人口学八卦组》专访,主要探讨了三个问题:
1. 现在似乎已经进入了大数据时代,大家很看重大数据,每个人都在谈论大数据,那么,社科研究应该怎么做或怎么看待大数据问题,大数据和传统研究数据的关系是什么?
2. 关于在新媒体时代,科学工作者应该如何面对大众的问题。对于公众号这种形式,科学工作者是否应该参与到对大众的科普中?
3. 关于人口学的发展问题,中国社会处在快速转型时期,中国的人口学发展也面临很多挑战,未来人口学的主要研究方向和重要研究议题有哪些?
谢宇教授认为,大数据的产生会影响到社会、研究和文化,但它为什么重要、怎么来用,绝大多数人都是茫然的。大数据是我们现代生活或工作留下来的数字脚印。现代化生活在很多地方都会留下数据的脚印,比如打电话、付帐、乘地铁、使用打车软件等,我们所有的行为都电子化了,这种电子化的生活方式和工作方式就为我们提供了可以利用电子化数据的机会。
大数据有几个典型的特点。
首先它并不是一个新事物,过去就有电子化的数据,比如美国的人口普查很早就有,当然有些已经失去了,而且并不是电子化的,但是它有数据,是为政府服务的。其次,大数据并不意味着“大”很重要,很多人说大数据的优势在于它很大,它这个“大”的确有它的规模很大的这层涵义,因为生活每时每刻都在产生数据,所以它的量很大。
但这个意义上的“大”还不是主要特征,它的主要特征是它的产生方式不一样,它不是为了研究而存在的,而是由我们生活和工作本身就能产生很多数据。
大数据有几个缺陷:1. 它虽然量大,但你仍然需要怀疑它的代表性。2. 大数据的变量可靠性和数据质量也是不确定的。3. 它的测量问题 (measurement)。4. 第四个缺陷可能是更致命的,就是数据整合 (data integration) 和数据厚度问题。
谢宇教授主张建立一个数据的生态,这个生态应该是有各种各样的数据,各种数据发挥不同的作用,大数据有大数据的作用,调查数据有调查数据的作用,政府数据也有政府数据的作用。
在中国现有独特的社会和网络生态下,科学家或者知识分子应该如何参与其中?谢宇教授认为,互联网的产生,实际上为中国的社会科学家提供了很多良机。除了对学术研究和合作的帮助之外,还有就是使学者跟大众能够有很好的互动,这在以前是没有的,现在一个微信(文章)可能有500万人读过,通过这样的方式,很多人都开始知道以前都没法知道的。
人口学应该用理论来探讨更深的社会议题,做更深入的研究,所以跨学科我觉得是最好的方案。我认为这个“大”人口学的概念就是人口学和其他不同学科的交集。这个交集点非常重要,因为任何量化研究,几乎都离不开人口学。