屠呦呦现象提出的科研评价机制改革议题

作者: 鲁白

来源: 知识分子

发布日期: 2015-10-26

屠呦呦的成就引发了对中国科研评价机制的深刻反思,尤其是院士制度的缺陷。本文探讨了原创性贡献在科研评价中的重要性,指出当前科研评价体制过于依赖人际关系和利益分配,亟需改革以更好地支持原创性研究。

早在2011年,屠呦呦获得有诺贝尔奖风向标之称的美国拉斯克奖,就曾引起中国舆论的深度关注和讨论。此次她获得诺贝尔生理学或医学奖,引发了更多的讨论。屠呦呦无博士学位、也无海外留学背景、头顶上更无中国两院院士头衔,被很多人戏称为“三无人员”。她连续获得拉斯克奖与诺贝尔奖,无论对科学研究本身,还是对当前科研评价体制,都提出了令人深思的问题。

由于人文社科研究与科学研究有所不同,本文主要讨论科学研究及其评价问题。

屠呦呦的原创性贡献是获奖的基础。诺贝尔奖评选委员会指出,由寄生虫引发的疾病困扰了人类几千年,构成重大的全球性健康问题,屠呦呦发现的青蒿素应用在治疗中,使疟疾患者的死亡率显著降低。超过十亿人受益于此次获奖的三位科学家的科学发现。

一般来说,诺贝尔医学奖颁给有重大影响力的科学发现,例如,发现某种方法或原理,改变了我们对细胞的认识,或者帮助我们加深认识生理过程,又如,能够大幅改变对疾病的治疗。全世界的科学标准应该是一样的,在这方面不应该有所谓的“中国特色”。应该考虑如下两个方面:一是原创,二是这个原创贡献对科学、对社会有没有重大影响。

以屠呦呦的研究为例,其原创性贡献主要体现为如下两点:在她之前,很多人都用各种传统的中草药提取,屠呦呦最后锁定在青蒿,这是第一个贡献;第二步是在同行普遍用煮的办法来提取的时候,屠呦呦采用了乙醚进行萃取。这两个发现和步骤奠定了她的得奖基础。她在30年前做出的成果,是在中国本土做出的具有世界一流水平的原创性工作,堪称中国近代新药研究中最重要的发现之一。

科学研究往往需要团队合作,科学家的原创性并不以工作量大小、是否亲手干,或者是否做完整个工作链条的事情为标准。其一,“亲手干”不是原创。屠呦呦当时是一个小组的领导,是团队的灵魂,重要的是她的原始想法。这个想法可以是由她的一个学生,一个助手,或者技术员做出来,而不一定由她本人亲手操作。其二,工作量的大小也不重要。其三,“工作完整”也不是原创的必要条件,尽管在科学上这很重要。

1972年屠在南京某次会议上讲了他们的研究想法,一些研究人员知道之后,用好的技术、人力和设备,取得了比屠呦呦更好的药物效果,但这个不算原创性的发现。是否具有原创性的关键问题是,在整个科学发现的长链中,哪个是最早最原始的想法,哪一个是最重要的关节点,在这个关节点上,是谁先想出最原始的解决办法。最早提出突破最重要关节的思想和想法的人,才是最重要的原创者。

中国院士制度缺乏以原创性贡献为内核的荣誉感。

屠呦呦无疑完全有资格进入院士行业,但她在国内没有拿到最高的科技大奖,也没有被评上两院院士。2011年屠呦呦荣获“拉斯克奖”之后,知识界和舆论界对我国科研评价体制做了反思,人们已对我国科研评价体制和院士遴选方式有所批评,遗憾的是,这些批评似乎并未获得相应的回应。四年之后,屠呦呦再获诺贝尔医学奖,可以更清晰地看到,目前院士遴选制度对有重大影响的原创性贡献仍然不够重视。

并不只是屠呦呦在院士评选上有这种遭遇。袁隆平在院士评选过程中亦曾多次落选,直到设立工程院之后才当选院士。袁隆平在评选院士问题上的境遇,与他的研究的巨大贡献,形成了令人遗憾的反差。院士遴选,不仅仅是对被遴选者的考验,也是对评审者的考验。屠呦呦作为诺奖得主未能当选两院院士,人们自然会问,为什么她没选上院士,难道选院士不应该是把做出最好的科学工作人选上去吗?难道不要对最好的科学成就有认可吗?

屠呦呦的落选并非偶然,目前院士制度出现这种尴尬局面有其内在原因,其内在缺陷,使得容易出现这种严重的“遗珠之憾”。其中的关键原因是,目前院士制度目前还不是一个荣誉制度,主要是一个利益制度,于是,在院士选举过程中人际关系等方面往往成为举足轻重的因素。现在当选两院院士意味着拥有可观的利益。当上院士,就会有大房子,有车,享受很多特殊待遇,还常常有官衔相随,院士常常会坐到大会主席台上。

而在一些西方国家,院士该排队的还是要排队,学术会议上根本就没有主席台一说,听人演讲时,无论多大牌的科学家都是规规矩矩坐在台下。即使得了诺贝尔奖,也不见得有特殊的待遇。笔者有一次与一位诺贝尔奖得主一起逛街,想打一辆出租车,但他坚持要坐地铁,因为那样更便宜。

由于目前院士连带有很多特权,于是有人不择手段地去把自己变成一个院士。这样的人评院士,争取的未必是学术的认同,而是背后的房子、车子、位子。

他们根本没想过国家发展和社会进步的需要,或者一项科学发现是不是非常有趣。由于两院院士的名额是有限的,一些不够条件的人为了把自己选进去,便需要把够格的候选者“比下去”,于是这些人的相当一部分努力,放在了如何不让那些够格的人当选。

于是,在选院士的过程中,虽然院士是选举出来的,但投票者选院士已经不再完全依靠科学成就了,人际关系、运作能力、个人的社会位置,都变成了重要因素,造成了今天的一个很奇怪的状况,就是有些人明明够格的选不上,有些人明明不够格的却选上了。在这种评选机制之下,屠呦呦无法当选院士,一方面可以说是奇怪的事情,另一方面,也并不奇怪。

两院院士制度的强烈利益化特征,很大程度上使得院士遴选制度无法将原创性贡献及其影响作为“生命线”,也无法围绕这一生命线确立院士制度本身的荣誉感。也就是说,如果院士身份不以做出原创性贡献的荣誉作为核心内涵,院士制度也不会形成自身的荣誉感,面对屠呦呦落选和公众舆论的批评可以长时间无动于衷。

斯坦福大学教授、拉斯克奖评审委员会成员露西·夏皮罗,曾经这样评价将拉斯克奖授予青蒿素发现的重要意义:“在人类的药物史上,我们如此庆祝一项能缓解数亿人疼痛和压力、并挽救上百个国家数百万人生命的发现的机会,并不常有。”这种评奖者自身的荣誉感,是奖项和评奖的公信力基础所在。

中国科研评价应以原创性贡献为核心。屠呦呦获诺贝尔奖与落选院士,对目前中国科研评价体制尤其是两院院士制度提出了深刻的挑战,也提供了丰富的启发。中国科学研究走向世界前列的进程,才刚起步,确立更为合理的、以原创性贡献为核心的科研评价体系和激励体系,对于未来中国科研发展具有重大意义。

院士制度是国家科研评价体系的“塔尖”,具有风向标的作用。

应该将两院院士作为一项表彰重要原创性贡献的荣誉,不宜与太多利益挂钩。不能因为获得了院士身份,就享有了更多的研究基金、决定权和人事权。院士应该回归到一个荣誉,表彰一个阶段性的工作,荣誉的认可并不意味着有很多额外的利益,不意味着可以得到比人家更多的资源。特别是那些理应通过学术竞争才能得到的利益,比如申请各种基金,这个应该回归学术竞争,靠今天的本事,把院士制度去利益化。

举例来说,一位美国科学院院士,刚刚因为他多年前的伟大工作得了诺贝尔奖,不久后却被美国休斯医学研究所告知,他不能继续得到该研究所的巨额资助,原因是他近5年的工作不如他以前做得好。

无论院士制度还是诺贝尔奖荣誉,都不宜与过多利益挂钩。例如,屠呦呦今天得了诺贝尔奖,只代表过去的贡献,只是荣誉和奖金。让科学家把学术认可本身当成最大的奖励,可以引导科学家们不要让关心学术成就带来的利益超越了关注学术本身。

更一般的优秀科学研究的评价标准,也应将原创性贡献作为核心内容。如何评价一位科学家的学术成就?什么样的科学工作才是优秀的?如果将原创性贡献搁置起来,或者将之置于次要位置,科研评价很容易偏离方向。

评价一位科学家的学术成就,会有一些比较客观的标准,例如论文的数量,影响因子,等等。一位科学家做出一项有影响的工作后,往往会受到一些专业会议的邀请去做报告,应邀在有些大学相关的系科演讲。

在做出一系列重要工作后,他/她常会被一些专业杂志邀请来写该领域的综述。当然,杂志的水平,学校的知名度,专业会议的级别,也能从一定程度上反映其学术水平。另外一个指标是申请到的科学基金的数量。但必须指出的是,我们不能过分地依赖于论文的数量,影响因子,更不能简单地以一个人的获得学位、职称、头衔或官职来衡量其科学成就。

拿生命科学领域来说,最为核心的评判标准应该是:有没有重要的原创性发现,有没有开创一个新的领域;有没有解决最基本的,最重要的生物学问题;有没有做出对本学科甚至对社会有巨大影响的科学思想、理论、技术、方法等方面的突破;有没有对人类的疾病提出新的认识,新的治疗方法;有没有做出对实际应用有巨大和明显意义的工作,等等。其他科学领域评价标准也类似。

优秀的科学工作是一个长期积累的过程,概括起来,好的研究工作大概可以分为以下几类:第一,经典学科领域的重大突破。比如葡萄糖转运蛋白,已经研究了半个世纪了,这么多科学家用各种各样的方法,就是不知道它的转运机制。清华大学的颜宁教授,解析了它的结构,从此可以了解它是怎样打开和关闭的。一个经典的古老的学科,从一个完全不同的角度来看问题,一下子有了突破。

顺便说一句,希望类似屠呦呦的得奖以后还不是中科院院士的情况,不要再次重演。

第二,可以被广泛使用的新的研究方法和技术。例如获诺贝尔奖的PCR技术和Patch Clamp技术。但有时候被非常广泛引用的技术性文章,还不一定是发表在Science、Nature杂志上。比如Patch Clamp技术的文章就是发表在一个不起眼的杂志上。近年来开发的CRISPR基因编辑技术,也属这一类。

第三,显而易见的实际应用。如发现了肝炎病毒的受体,就可以想办法阻止它进入人类的细胞,应用的前景显而易见。又比如找到老年痴呆症的基因,这样就有可能及早预防和治疗老年痴呆症,否则无从入手。

第四,提出全新的概念。例如神经营养因子一直是被认为起着促进神经细胞营养的作用,如发育、分化,但1996年发现神经营养因子可以调控脑内突触的可塑性,最终它也许可以调控学习记忆。这在当时是一个全新的概念。

第五,打破传统的理论体系。这与上面讲的是对应的,一个是能提出一个新的概念,另外是打破一个旧的观念,就是说我要提出反对意见,原来的概念有问题,对它提出挑战,提出这样的问题,也是一个很好的工作。

第六,开创崭新的领域,例如获得2012年诺贝尔奖的诱导多能干细胞(iPS cell)的工作,开创了一个新的领域。许多工作就在此基础上开展。

草偃风从,如果在优秀科研评价标准中能够以原创性贡献作为首要的考量对象,可以对科学界的研究工作和风气,尤其是对年轻科学家的研究目标的形成,起到良好的引导作用。

科学道德在原创研究中至关重要。近年来,在一些国际著名的科学杂志上,越来越多地刊发来自中国科学界的论文,这说明中国科学在进步。但也不难看到,有些作者不惜一切代价来迎合评审者的要求,以至文章中会出现一些不合理或与主体无太大关系的段落和图片。这是学风不正。还有一些作者编造篡改数据,弄虚做假,你要什么数据我就给什么数据,以求评审过关。这就是学术道德的问题了。

今年,《自然》杂志网站报道,英国BMC出版社撤回43篇学术论文,国际出版集团施普林格也撤回集团旗下10本学术周刊上发表的64篇科研论文。两次论文撤回事件的原因,都是同行评议过程中存在造假现象,涉事论文的作者绝大多数来自中国。一些第三方机构涉嫌参与造假,这些机构在作者提交论文前,提供论文格式优化、语言润色等服务,甚至可能协助或主导了同行评议的造假行为。这样的风气,严重阻碍了原创研究的正常进行。

学术道德不端中最基本的有三条,一是造假,二是篡改,三是剽窃。现在中国的剽窃现象很严重。甚至在很多知名大学中的资深教授,都不认为剽窃别人的想法,创意是件大不了的事,对学术道德观念模糊,对侵犯知识产权的意识十分淡漠,认为谁做出来就是英雄。

比如A和B两个科学家聊天,A听说了B有某个想法,或正在做某个课题,但A听后,并不告知B自己也在做此类课题,而是进一步套他的话,了解相关信息,并抓紧实施B的想法,赶在B之前发表科研成果。有一种“我做出来就是我的”的想法。弄虚作假,不择手段地抢资源,抢作者权的事情在中国并不鲜见。更有甚者,有些人还通过隐瞒,故意散布不真实情况,甚至用欺骗,撒谎的手段,来获取学术成果。

这些做法严重影响了科学家之间的信任,也破坏了学术界自由交流的气氛。中国要成为科技强国,学术道德不端将成为主要瓶颈之一。

学术不端事件严重地损害了中国科学家的形象。这些现象的猖獗,很重要的原因是执法不严,惩罚不重。另外,体制也是一个原因。正是科研评价中过于重视论文发表数量和影响因子,并根据这些标准来确定如何分配利益,形成了过于急功近利的科研文化。

将论文数量与影响因子作为首要评价标准,科学研究评价便会变成简单的数数,数有多少《科学》、《自然》的文章,数论文的影响因子是多少。笔者在与一些国内科学家的接触中,常发现对方马上就会脱口而出说,这篇文章的影响因子是几点几分。

追求新奇是科学家的一个基本特质。由于利益分配与这种“数数”的评价标准挂钩,科研工作容易迷失,只想着不断发表未必需要原创性贡献的论文和“成果”,而无意进行科学研究的冒险,去探索别人没走过的路。从事科学研究,需要有“敢做”的精神,做科学技术上的重大问题,做对人类社会有深远意义的课题,科学工作者投入这些工作,需要自觉地突破“数数”的评价标准所形成的科研文化。

政府的科研资助应致力于扶持原创性思想和研究。当年屠呦呦发现和提取青蒿素,张亭栋将砒霜用于治疗白血病,这些成就都是在艰苦条件下取得的。如今科研投入越来越多,在重大成果产出方面却不尽如人意。这一现象说明,科学研究做出原创性贡献的主要基础并非大量的科研资金投入,而是敢于挑战重大难题的精神与努力。因此,科研评价体制的设计、科研资金投入制度的设计,都需要以给予挑战重大难题的原创性研究必要扶持为首要目标。

其实,投钱多、实验室大不一定是好事,往往在手头有点紧张时反而能够全身心投入研究的突破。有些研究项目投钱太多,反而害了科学家,手中一旦拿到一大笔钱,就得想很多题目来做,考虑如何公平地分配资金、如何平衡各方利益,反而分散了精力。近年来国内一些实验室日益庞大,不少实验室超过了20多人,很多是没有什么经验的学生。即使是一个很有经验的科学领导者,也很难指导这么多人。

最终实验室的科研人员成了流水线上的员工,没有创造性思维可言。

一些世界顶尖的研究所规定,一个刚入职的助理教授只能带3个人的团队,一个正教授的团队一般不超过6个人,这样可以鼓励大家去把自己最好的东西做出来,而不是横跨很多领域,不是做的东西多就是重要的。

位于剑桥的英国医学研究委员会(MRC)分子生物学实验室,上世纪80年代初,固定研究人员只有69人,获诺贝尔奖却高达8人次,是全世界生物学实验室中获得诺贝尔奖密度最高的。这家实验室的核心定位是,“物色真正有原创思想的人,然后造成一种环境,使原创思想得以萌发而导致科学的突破。”

现在政府研究经费的投入近年来持续增长,但并未将扶持原创性思想和研究作为首要的目标。

鲁白,邹承鲁和饶毅曾在2004年《自然》杂志、后来施一公和饶毅又在2010年在《科学》杂志发表社论文章,批评中国科研基金的分配体制,他们指出,关键问题在于每年针对特定研究领域和项目颁发的申请指南。表面上,这些指南的目的是勾画“国家重大需求”;然而,人们基本上可以毫无悬念地意识到这些“需求”并非国家真正所需。

政府官员任命的专家委员会负责编写年度申请指南,所谓“专家意见”不过反映了很小部分官员及其赏识的科学家之间的相互理解。这种自上而下的方式不仅压抑了创新,也让每个人都很清楚:与个别官员和少数强势科学家搞好关系才最重要,因为他们主宰了经费申请指南制定的全过程。在中国,为了获得重大项目,一个公开的秘密是:作好的研究不如与官员和他们赏识的专家拉关系重要。

“屠呦呦现象”的重要性在于,再一次地极为醒目地提示了,“拉关系”如何严重地妨碍了正常的科研评价。中国科研基金分配的痼疾现在日益为社会所关注,决策者也逐渐意识到问题所在,有关部门正在发起一系列的科技体制的改革措施。科研基金分配体制改革的要害是,如何更有利于发现那些敢于挑战重大难题的课题,如何对那些原创性努力尤其是年轻学者的原创性努力,想方设法给予必要的扶持。

首要的问题则是,如何限制现行体制的既得利益者,开展真正意义上的改革。

UUID: f14d49b3-b2e3-41c4-bae2-17993e8c508f

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/知识分子公众号-pdf2txt/2015-2016年/2015-10-26_鲁白:“屠呦呦现象”提出的科研评价机制改革议题.txt

是否为广告: 否

处理费用: 0.0296 元