有时候,生态学数据就是那么的不合情理。在英属哥伦比亚弗雷泽河产卵的红鲑就是一个例子。从1948年起,科学家们就已经开始了对该地区渔业的追踪调查,从那时到现在,鱼的数量已历经数轮起起落落。起初,种群数量似乎与海水温度呈负相关:每隔几十年,北太平洋表面温度都会经历一个先变暖再变冷的过程,在追踪调查的头几年,当海洋表面温度下降时,鱼类数目似乎会上升。
对于生物学家来说,这似乎很合乎情理,因为鲑鱼适宜在低温水域中繁殖生息。描述种群数量与温度关系的方程可以为渔业管理人员设置捕捞限制提供依据,从而避免过度捕捞。但是,在20世纪70年代中期,一些奇怪的事情发生了:海洋温度和鱼类数量的变化不再同步。科学家们曾认为的这两个变量间存在的紧密关联似乎是个错觉,鲑鱼的数量只是在随机波动。
试图凭借对鱼类生物习性的粗浅了解管理好重要的鲑鱼渔业,斯克里普斯海洋研究所的生态学家George Sugihara认为这实在是荒唐。不过,他和同事认为他们已经解开了弗雷泽河鲑鱼之谜。他们的关键灵感就是抛弃方程。George Sugihara是斯克里普斯海洋研究所的生态学家,他认为使用方程为许多自然系统建模是很愚蠢的。
Sugihara的团队研究出了一种基于混沌理论的方法,他们称之为“经验动态建模”,该方法没有对鲑鱼的生物习性做出任何假设,只用原始数据作为输入信息。在设计方法的过程中,科学家们发现海洋表面温度确实可以帮助预测鲑鱼种群数量的波动,即使两者并不是通过简单方式关联在一起的。Sugihara表示,经验动态建模可以揭示自然界里无处不在的复杂系统中的隐藏因果关系。
现在,Sugihara与同事正在将他们的想法付诸实践。他们的方法对2014年弗雷泽河鲑鱼洄游的预测比其他任何方法都要精确,今年早些时候,《美国科学院院报》对这项工作进行了报道。Sugihara的方法预测出的洄游数量是450万到910万条,而太平洋鲑鱼委员会的模型预测的则是690万到2000万条——这个预测区间太宽,对于想知道应该在下一个捕鱼季调配多少船只的渔民等基本没有指导作用。
最终的实际数量是880万条左右。这项成功是以Sugihara与同事对太平洋沙丁鱼的研究成果为基础的,他们正同美国国家海洋和大气局的科学家一道,将这种方法运用到墨西哥湾和大西洋的鲱鱼上。领导这项研究的生态学家希望Sugihara的方法为该领域提供急需的预测能力,不仅是用在海洋渔业上,还可适用于许多其他生态系统。美国地质调查局的生态学家Don DeAngelis将其称为“一项重大的理论突破。
”Sugihara和其他一些研究人员开始将这种方法的应用从生态学拓展到金融学、神经科学、甚至遗传学。这些领域都涉及到复杂而多变的现象,很难、甚至不可能通过统治科学界近300年的方程模型进行预测。DeAngelis表示,对于这样的系统,经验动态建模“很可能是未来的方向”。经验动态建模可以追溯到30多年前。在20世纪70年代末,荷兰数学家Floris Takens就在研究混沌理论。
20世纪60年代,由于科学家们已经意识到许多自然界的复杂现象难以预测,混沌理论逐渐出现了。在混沌系统中,微小的扰动就会导致巨大且看来无法预测的结果,一个典型的例子就是:一只蝴蝶扇动翅膀就会影响千里之外的天气。Takens努力从混沌中寻找规律。
他同物理学家David Ruelle一起,提出了“奇异吸引子”的概念——坐标系中的一组点集构成了影响整个系统的变量,系统状态围绕着吸引子随时间变化的曲线弯曲盘旋,就像一个纱线球。然而,在许多自然系统中,构成坐标系的相关变量的数目非常巨大。决定某时某地天气状况的因素几乎无穷多,并且某些因素很难测量——例如,北极上空3英里处的气压。但是,我们可以假定你能连贯而精确的测量一个变量,比如纽约的气温。
Takens发现了一种利用某个变量现在和过去的测量值来获取系统全部信息的方法。这种方法需要利用过去测量值创建另一个坐标系;换句话说,一个坐标轴可能是今天时代广场的温度,第二个坐标轴可能是昨天的温度,第三个坐标轴是两天前的温度,依此类推。Takens证实了混沌系统的全状态至少在理论上都可以嵌入一个单变量时间序列中。他在1981年发表了他的“嵌入定理”。
这个定理“反响巨大”,乔治梅森大学的数学家Timothy Sauer说,他曾经对最初的定理进行了拓展,从而使该定理的应用范围更加广泛。科学家们的下一步工作就是将其应用到现实世界,但是自然界的无序性与Takens数学理论的纯粹性产生了冲突。尽管天气为混沌理论的研究提供了最初的动力,但是仍然无法实现对于天气的准确预测,因为其中持续变化的因素太多,而没有任何一个变量能真正能获取所有信息。
Sauer表示,只有当影响因素非常少时,Takens定理才能有些作用。当Sugihara还在普林斯顿大学读研究生时,就已经对Takens定理有所了解,他当时和Robert May一起工作,Robert May是一名训练有素的物理学家,在20世纪70年代初转向生态学研究。May擅长简单而优雅的理论研究,他的一项研究证明了单一物种的种群数量也会随机波动。
Sugihara对能否以May的进展为基础进一步使用真实世界的数据产生了兴趣。在1986年,他获得博士学位几年后,Sugihara转到斯克里普斯研究所,着手进行浮游生物数据的分析,这些数据由那里的一名研究人员在20世纪二三十年代收集。“那真是了不起的数据集,” Sugihara说,“我知道肯定有某种从中获得良好信息的方法。
”基于浮游生物数据的分析及其他研究者对麻疹、水痘的研究,Sugihara和May于1990年在《自然》上发文,描述了Takens定理是如何在某些非线性系统中进行短期预测的。该方法的精髓在于从系统的吸引子图上找出能代表系统当前状态的点。通过一到两个步骤,就可以预测系统会按照与过去类似的模式发展。这篇文章已经被多个学科的科学家们引用超过1000次。
这篇文章也促使Sugihara在职业生涯中期进军金融界,因为当时许多公司都对利用类似的方法进行股票预测很感兴趣。在2002年,Sugihara重返科学界。他还有未完成的工作:向整个世界证明,尽管生态系统复杂而混乱,但它依然是可预测的,管理人员可以利用这些预测来改进工作。“我感觉我身负重任,”他说,“让人们理解其中的道理——开始拥抱自然系统,尽管它们和我们曾预想的大相径庭。
”生态建模始于近100年前,它从一开始就受到了物理学和工程学的深刻影响。在之前200年中,物理学和工程学都在用微分方程描述动态系统。举个例子,应用最为广泛的渔业模型是Ricker模型,由加拿大生物学家William Ricker在20世纪50年代提出,目的是预测现存鱼群在来年可以生产多少新的成年鱼。Ricker的原始方程包含了两个参数:给定鱼群的繁殖率,以及环境所能供养的鱼类总量,即“承载能力”。
渔业管理者仍然十分依赖Ricker模型,利用包含温度等因素在内的变量,来估算渔民们可获得的“最大可持续产量”而又不至于让鱼类资源枯竭 。Sugihara表示,这种估算太过天真,因为他们假设鱼的种群数量和环境因素通过一种简单的静态方式关联。“写下一个猜测温度应该通过某种方式施加影响的方程,这种行为实在是有些狂妄自大。
”环境因素——气候、大洋环流、人类影响——都在不断地变化,但是诸如此类的参数化模型却囿于时间而无法适应这些变化,很难将多因素协同起来而使模型更加精确。“即使获取了更多数据,也不一定能改进那些模型。” Sugihara说。与之相反,经验动态建模可以无缝地并入新的数据,而且数据量的增加总会优化模型结果。
当数据量足够大,可以形成致密的吸引子时,Takens定理的效果最好,更易于找到系统当前状态接近于前一状态的时间点。任何新的数据点都可以帮助用户观察系统的变化趋势。“这种方法可以从数据中揭示内在的关联,” Sugihara说。这种方法确实获得了成功,他说:“当付诸于实际应用时。”也就是说,取得了很好的预测结果,而不仅是在事后做出了漂亮的拟合曲线。
Sugihara的工作并非纸上空谈的数学:许多渔业科学家都渴望更好的预测,NOAA和加拿大渔业海洋部的研究人员与Sugihara及其学生共同署名发表了一些文章。 然而,到目前为止,还没有哪家渔业委员会真正地将这些方法引入管理实践中。
DFO的退休分析师Jon Schnute表示,一个难题是,目前只有Sugihara和他的同事有进入底层算法的权限,这意味着渔业生物学家必须将他们的数据发送到斯克里普斯研究所,然后等待预测结果。相比之下,所有渔业生态学家都有采用Ricker模型的软件可以用。经验动态建模“还不够成熟,” Schnute说。这样的状况正在逐渐发生变化。
研究者现在已经可以使用Sugihara的软件了,他的学生还开设了一些讲习班来教授软件的用法。DeAngelis过去一直使用参数化方程,现在他希望能利用Sugihara的方法预测大沼泽地鱼类种群数量的动态。
方程的终结DeAngelis还做了进一步的工作,2015年, Sugihara的团队在PNAS上发表文章,认为经验动态建模可能会参与到一项巨大的变革中,将长期统治科学界的方程式搬下神坛,DeAngelis就此发表了评论。包括DeAngelis在内的许多评论者都注意到,在生态学中,方程并没有取得在物理学中那样的成功,这意味着需要开发新的方法。Sugihara同意这一点。
他表示,静力平衡方程在桥梁建造中可能非常有用,但是,现在是时候放弃在大自然的复杂非线性系统中寻找平衡了。他观察到,吸引人的简单关联可能会在一段时间内出现,但是在混沌系统中,这种关联并不能让我们洞悉真相。“并非世界神秘莫测,”他说,“而是我们观察世界的方法使它显得神秘莫测。”生态学家们深受新方法的鼓舞,但是他们没有忘记Sugihara面临的挑战。数据的缺乏仍然是一个很大的问题。
尽管像医学和神经科学这样的领域已经可以快速产生巨大的数据集,数据生产的速度甚至比科学家处理数据的速度还要快,但是,生态学还蹒跚在通往大数据革命的道路上。Sauer表示,一个更困难的问题可能是时间序列的稳定性——一个测量值在今天和明天、今年和明年、这几十年和下几十年是否有着同样的含义。稳定性是实验科学的一个重要特点:一个蛋白质分子或酵母细胞在今天和100年前都是同一类事物。
但是,2015年的弗雷泽河红鲑种群数量记录与1950年同种鲑鱼的数量记录是否有着相同的含义?这恐怕就不那么清楚了。在这期间,DFO更改了对鲑鱼存量的定义,而且甚至鱼类本身也可能发生了演化。DeAngelis补充道,经验动态建模还有另一个局限:这种方法只能做出短期预测。这就要归结到混沌系统的根本问题上了:两个系统初始状态极其细微的差异,都会导致完全不同的发展轨迹。
在实际工作中这意味着,即使这种方法能准确预测下一年的鲑鱼种群数量,它也不能可靠地预测几年后的种群数量。基于这些及其他的一些理由,Sugihara开始将他的方法推广到生态学以外的领域。几年前,Sugihara收到了一封来自Gerald Pao的邮件,Pao是索尔克生物研究所Inder Verma实验室的分子生物学家,这所实验室和斯克里普斯在同一条街上。
Pao确信Sugihara的方法可用于解释基因表达数据。Sugihara一开始持怀疑态度,但是当他意识到Pao的数据量是多么的庞大时——每小时对人类染色体全部的25000多个基因的表达进行测量,以此构成协同的时间序列——他意识到他错了。Sugihara、Pao和Verma从酵母菌和老鼠的模型开始做起,希望能尽快发表一篇文章,来展示基因网络是如何在表达谱不相关的情况下产生因果联系的。
类似于经验动态建模的想法也出现在了神经科学中。神经科学家非常希望能预测癫痫等严重症状的发作,还有人利用Takens定理对神经网络的放电模式进行建模。Sauer表示,在将这项理论付诸实践的过程中,神经科学家可能会比生态学家走得更远。但是,他说,“真正的杀手锏还没有出现。”Sugihara也同意这样的评价。“Takens定理十分神奇,”他说,“很显然,其应用潜力还没有被完全认识到。
”他补充道,“我认为这改变刚刚开始……我认为我们正开始克服理解这些理论所需的‘活化能’。”