科学一直被认为是人类智慧金字塔尖的明珠,科学探索则被认为是人类中最聪明的那一群人的独享技能。阿基米德、哥白尼、伽利略、牛顿、爱因斯坦等等这些如雷贯耳的名字,留下了无数让我们耳熟能详的故事。这些故事激励着一代又一代仰望星空的人们,脚踏实地地推动着科学的进步。
还记得那张集合着二十世纪人类最聪明大脑的合影么?这几十个人奠定并推动了现代物理学的发展。但如果你不是物理学工作者,那么看到这张照片时,也许除了崇敬之情并不会有其他的感受。毕竟大众的刻板印象是:科学探索离现实生活还是比较遥远的,享受科技发展带来的成果可以有效地提高我们的生活品质,科学发现则是那些专业的科学家们的工作。
但是随着大数据时代的到来,一切都开始变得不同了。
在以前数据量还不是很大的时候,科学家们会先寻找有意思的研究对象,然后再仔细研究所选对象的性质。由于数据量有限,从母样本中寻找特定的研究对象不是特别困难的事情。然而,随着科学数据的不断增加,例如未来在天体物理学领域里的大尺度巡天设备会带来数以PetaByte (PB, 1PB=1024^2 GB)计的数据,使得科学家们在浩瀚的数据海洋中寻找自己感兴趣的研究对象变得越来越困难。
甚至很多时候,对于天文学家来说,寻找目标天体都成了一个科研项目的主要工作量所在。
为了解决科学家们在大数据时代所面临的问题,经过多年的实践,人们选择了机器学习(Machine Learning)和公众科学(Citizen Science)两个方法。机器学习的方法就是通过应用最新的机器学习的算法帮助科学家实现数据处理的自动化和高速化。但是目前已有的机器学的方法(尤其是监督学习)还无法做到联想和自动扩展,因此在普适性和灵活性方面存在明显的短板。
公众科学是指通过合理地设计用户界面,让大众参与到海量科学数据的处理中来。这个过程不需要志愿者有很多的数学物理背景,只需要志愿者通过数据的可视化和软件的互动操作来实现科学数据预处理的并行化。也就是说,众多志愿者同时且独立地处理数据,类似于电脑的多线程。然后,专业的科学家们会对预处理的数据进行更进一步的科学分析来得到相应的科学成果。
由于人脑在灵活性上要远超目前机器学习的算法,所以公众科学不但能在某种程度上独立地解决大数据问题,而且还可以与机器学习的方法结合起来,让科研工作变得更加高效灵活。
本文会为读者介绍公众科学在天体物理中的应用,包括公众科学的定义、现状、以及公众科学在中国的机遇和挑战。希望能为您带来一些启发。