我们的大脑由数十亿个神经元组成,而这些神经元又通过数万亿个突触连接起来。神经元的排列方式决定着大脑的功能和一个人的个性。最近,瑞士的科学家首次发布了“蓝脑计划”绘制的数字3D脑细胞图谱——他们详尽构建了一只老鼠大脑的完整细胞图谱。在庆贺这是一重大成就的同时,科学家也面临着巨大的挑战:如何破译这些图谱。
如何将大量的信息转化为有用的见解?科学中充满了这样的问题。
多年来,研究人员依靠数学和统计学对数据进行深挖与探索。由数字存储、互联网和低廉的传感器导致的大型数据集的爆炸式增长,催生了许多专门用于处理“大数据”的新技术。如今,在一种已存在了百年之久的思想之上,建立起了一种新的方法。它的出现为理解一些特定类型的大数据提供了更好的工具。以老鼠的大脑为例,大脑的物理形状决定了它的功能。然而,即使有了大脑形状的精确描述,也并不能就自动揭示出大脑如何工作的全部奥秘。
拓扑学是现代几何学的一个分支,它的起源可以追溯到瑞士数学家欧拉对多面体所做的基本观察。多面体是由平面、直线的边和尖锐的角组成的三维形状。1750年,欧拉发现,对于任意的凸多面体,顶点数减去边数加上面的数量总为2。同样的公式也可以应用于其他形状,来得到它们的欧拉示性数。无论形状如何弯曲或变形,欧拉示性数都保持不变。拓扑学研究的正是形状的不变特性。
作为一门重要的纯数学学科,拓扑学在20世纪经历了快速的发展。创建这门学科的研究者最初只是对特定条件下的几何形状的数学特性感兴趣,并没有想着要有什么现实应用。然而,存在了100多年的拓扑学中的一些思想,却在如今的数据科学领域找到了重要的应用。
拓扑学也可以用来改进新药物的开发。药物是经过设计的化学物质,它们以一种特殊的方式与体内特定的细胞相互作用。
具体说来就是细胞上有受体,可以让特定形状的分子锁定它们,从而改变细胞的行为。所以,制造具有这些形状的药物就能使它们瞄准和影响正确的细胞。事实证明,制造出具有特定形状的分子是一个相当简单的过程。但将药物送到靶细胞的最简单方法就是通过血液输送,因此,药物必须是水溶性的。当一种形状正确的药物被生产出来后,最重要的问题是:它会溶解在水中吗?然而,仅仅知道分子的化学结构很难回答这个问题。
许多药物开发项目都因为溶解性问题而失败。这就是拓扑学的用武之地。把整个分子集合看作一种可以用几何方法研究的数学实体,这种方法被称为“分子空间”。对于开发新药物而言,一张分子空间的图谱将是一个强大的工具,如果这张地图上包含了指示溶解概率更高的地标,那就更是如此了。
在越来越多的科学领域,研究人员发现,他们掌握的数据多于他们能够有效理解的数据。面对大数据带来的数学挑战,现代数学家的应对之策仍在展开,而拓扑作为一种只受想象力束缚的理论,必将有助于塑造大数据的未来。