在统计某个区域内居住的人口时,通过上门走访和邮寄问卷的方式可能要花上几年时间;不过,在最新的一项研究中,科学家们提出了一种新方法——他们开发了一种利用手机记录进行人口统计的方法,不但可以获得居住地的信息,还能了解人口的动态。研究论文于10月27日发表在《美国科学院院刊》(PNAS)上。
比利时那慕尔大学的应用数学家雷诺·朗比奥特(Renaud Lambiotte)本人没有参加这项研究,他对此评价道:“这是人们第一次用数据证明,用手机记录得到的人口数据质量很高。”
世界上96%的人都在使用手机。在发达国家,手机服务订阅人数甚至超过了总人口,因为有些人拥有一部以上的手机。而在发展中国家,手机的使用人数也在不断攀升,可达国家总人口的90%。这对人口普查学家来说是非常有利的,因为他们可以利用手机信号塔来定位手机通话人所在的地点,并用信号塔周围的通话密度来估计当地的人口密度。
作为绘制世界各国详细人口信息的开源项目WorldPop的一部分,比利时布鲁塞尔自由大学的地理学家凯瑟琳·林纳德(Catherine Linard)和鲁汶大学的数据科学家皮耶尔·德维尔(Pierre Deville)领导的研究团队,利用手机数据估计了法国和葡萄牙的人口密度。他们从每个国家的主要手机运营商处获得了汇总并且匿名的通话记录,总计超过10亿。
在葡萄牙,这些通话来自200万名用户,占总人口的约20%。每个通话都由网络运营商记录了发送和接受信号的手机基站、通话时长以及用户标识符,用于话费统计。在法国,这些记录来自1700万名用户,占总人口的约30%。由于两国运营商的政策不同,法国的数据仅包括当天的通话记录。
利用通话记录,研究者们开发了一个模型,用通话密度来估计每个手机信号塔周围的人口密度,并将手机信号塔覆盖范围较高和较低区域内,手机使用情况的差异考虑在内。结果可以看到,不同时间和不同季节里,人口动态的明显趋势,这种信息是以调查为主的传统人口普查所无法反映的。在节假日里,城市里的人口锐减,而沿海和巴黎迪士尼公园等旅游景点的人数则激增。在一周里,工作日的时候人们到城市里上班,周末时则会回到郊区。
研究者们还将他们的结果与利用遥感技术所获得的人口密度数据进行了对比,后者是被广泛使用的一种方法,用卫星图像来收集人口居住模式的具体信息,并估计人口数量。结果表明,这两种方法与基于调查的人口普查数据相比,在准确度上相当,但是利用手机数据能够获得更及时的信息,可以具体到每个小时。
然而,林纳德表示,这种方法也有不足之处,如果要在其它国家使用该方法,研究小组就必须根据不同的手机使用模式来对他们的模型做出调整。比如,有些国家的人可能更喜欢发短信而不是打电话,又或者某个区域的居民都太穷,用不起手机。她说,这种方法如果与例如遥感等技术结合使用,效果会很好,而不应代替人口调查。
美国人口统计局的首席科学家汤姆·路易斯(Tom Louis)认为,这项研究展示了大数据的优势和局限性:虽然可以获得及时信息,但这个方法的准确度还没达到正式使用的标准。他表示:“大数据非常有价值,但目前来说,还需要用传统的方法来对其进行验证。”
不过,林纳德表示,对于低收入国家来说,那里的人口统计信息很可能已经过时且不可靠了,而手机记录是一个简单有效的替代方法。例如,在刚果共和国,最近的一次人口普查是在1984年,相比之下,该国的手机用户已达70%。研究论文共同作者,英国南安普顿大学的地理学家安德鲁·泰特姆(Andrew Tatem)认为,在埃博拉疫情继续蔓延的情况下,手机记录可以作为一个十分有用的工具来追踪人口动态。
他领导的WorldPop项目小组已经利用了来自塞内加尔和象牙海岸的手机数据,建立了一种不同的模型,来估计受到埃博拉影响的西非国家的人口流动情况。他表示,越容易获得这些国家的最新数据,就越能对人口流动做出准确的判断,而这可以帮助各国政府协调针对疫情的应对措施。