也许正如我的许多亲朋好友一样,你生活质量也因普萘洛尔(propranolol)得到了提升。这是一种β受体阻滞剂,能够缓解压力激素的作用,被用于治疗高血压、胸口疼痛、心率不齐和偏头痛。它被认为是20世纪最重要的药学突破之一。普萘洛尔 图片来源:ScienceBlogs
倘若如此,你就该谢天谢地,上世纪四十年代的美国对待科研经费的态度并不像今天这样。
否则,你就会看到七个专家围着一张桌子坐下来,为一份野路子的经费申请书打分,它的研究内容是肾上腺素在体内的作用。一位资深医师或许会说:“如果我没有误解作者的意图的话,这个机制已经被研究透了。”只有一位的生理学家提出抗议,但药理学家们对此不屑一顾,其中还有人指出申请书里的数学运算“看起来非常繁琐不便”。
于是,这位为普萘洛尔的发现奠定了基础的,来自乔治亚医学院的已故的雷蒙德·阿尔奎斯特(Raymond Ahlquist)教授,他的开创性的研究很可能只得到了低分——他的理论也就永远无法为世人所知。
科学研究十分昂贵。我们无法资助每个科学家,所以我们需要一些方法来决定谁的研究值得投资。那么,该如何选择呢?目前,专家评审花费大量的时间来挑选最好的研究,以分配研究经费。但实际上,他们并不怎么擅长这项工作,整个过程纯属浪费时间。也许更好的办法是放弃筛选优秀者的方法,用抽奖的方式发放经费。
目前的研究经费分配流程表面上看起来非常合理。申请截止日之后,学者们对收到的申请书进行评估。例如,分子生物学评委小组可能要在两份申请书之间进行权衡,前者的内容是探索可能与阿尔茨海默症有关的新的生化途径,后者则是筛查大分子蛋白数据库,以开发新的糖尿病疗法。每个评估者都对申请书打分,然后我们对不同评估者的分数取平均值。研究经费按照申请获得的分数从高到低依次发放,直到额度用完为止。
这种方式有一个大问题,就是我们还远远没到研究质量的分水岭时,经费就发完了。尽管研究经费整体而言越来越多,但研究者的数量增长得更快。于是,研究经费申请者的成功率一直在下降,且富有冒险精神的研究提议很难得到资助。上世纪七十年代的一个评审团也许能为40%的申请者发放资助,也就是说它不仅能支持所有优秀、可靠的研究申请,还能在某些风险较大的项目上面小赌一把。
今天,一个评审团通常只能为20%甚至更少的申请书发出经费,像阿尔奎斯特的研究这样的项目得到足够经费支持的机会十分渺茫。
同行评审还增加了另一个不合条理的层面。英国政府首席科学顾问、英国最大的慈善资助机构维康信托基金会(Wellcome Trust)前主席马克·沃尔波特爵士(Sir Mark Walport)曾将同行评审称为一种二联性精神病(folie à deux),因为它依赖于研究者和评议者所共有的妄想——他们都认为自己可以做出准确的预测。
从申请者的角度来说,他们需要提交一份操作计划和一系列目标,或者说“可交付结果”,而在项目开始阶段这些结果大部分都难以预测。毕竟,研究就在于发现你不知道的东西,所以这是一个相当混乱、难以预估的过程。在一个TED演讲中,系统生物学家尤里·阿隆(Uri Alon)将科学比做即兴剧。
你原以为自己要从A到B,但半路上你迷路了,卡在那儿,甚至完全忘了自己在干什么;然而如果你努力坚持一段时间,你可能会找到C,它本身是有价值的。但是,如果你对资助者承诺从A到B,那么找到C就变得困难多了,而且不管怎么说你都不太可能找到B……
评审员也患有类似的“精确妄想症”。给申请书打分的时候,评审小组其实是在猜测:如果给予足够的时间,哪些项目将对社会作出最大的贡献?
然而,我们仍然不甚了解一个项目从最初的资助到产生更广泛的社会影响之间经历的过程,且这个过程可能长达30到50年。要是自以为能用精确到小数点后几位的数字指明哪些项目最有可能成功,这可太荒谬了。对评级的迷恋还意味着我们需要从申请者那里获取极大量的信息,这也会大量浪费他们的时间。
在澳大利亚,在最近一轮医学研究经费年度申请中,科学家们花了等同于400年的时间来撰写那些最终被拒绝了的申请。
最后一点,“专家评审员”并非可代替商品。评审员之间千差万别,他们的判断也是非常个人化的。一项著名的研究结果表明,在2009年澳大利亚申请公共资助的近3000份医学研究申请书中,如果换一个评审团队,接近一半会收到截然相反的评价。所以,这一过程不仅效率低下,还有着系统偏差。有证据表明女性和少数族裔得到资助的机会分别低于和他们一同竞争的男性和白种人。
好在,这些问题有一个简单的解决方案。
我们应该告诉专家们,别再挑选最好的研究了。相反,他们应该专注于扔掉最糟糕的想法,然后在剩余的申请中进行抽签。通过这样的方式,我们可以缩减申请书的长度,因为接受还是拒绝让它参加随机抽奖,这个决策需要的信息更少,而且极其详细的申请书本来也是不现实的。所以,与其要求评审员作出不合理的预测,不如让他们专心找出荒唐的、骗经费的计划。
当然,在筛选阶段偏见仍然存在,但更多的申请书还是能进入抽奖池,而抽奖池是没有偏见的。新西兰健康研究委员会(New Zealand Health Research Council)正在测试一个这样的项目,不过他们的奖金每年只能资助四位研究者,这个样本量太小,无法说服更大的资助者。
同行评议系统存在着很大的不合理性。 图片来源:theconversation.com
抽奖这种解决方案听起来可能有点极端,似乎把孩子和洗澡水一起倒掉了。并非所有的科研申请都需要花几十年才能看到成效,有时学界也能达成高度一致,认为某个方向的研究是重要的、适时的。但是,我们也许能留出一小部分的研究经费,用于资助得到专家评审团一致认可的项目。随后,我们筛掉不靠谱的申请,把其他的统统扔进抽奖箱。这种分选方法的要点是把资金主体留给随机且风险较大的申请。
我仍然不确定哪种方式更好——我已经对两种场景进行了计算机模拟,虽然两种方法的效果看起来都比现行系统要好,但两者之间哪个更好就不确定了。其他研究科研经费分配并同意需要进行抽奖的专家仍然对此有着不同的意见(这很正常)。还需要进行更多的实验。
发明普萘洛尔的诺贝尔奖获得者詹姆斯·布莱克爵士(Sir James Black)曾说,同行评议系统是科学创造性的敌人,并且如果没有阿尔奎斯特的理论,他的工作便不可能实现。科学思考通常能够带来进步,但科研体制也能造成严重的倒退。面对事实吧:申请经费不管怎么说都是一种抽奖。我们至少应该把它变成一种官方抽奖,以便让整个过程更加经济、公平和高效。