科技评价老大难：原地徘徊甚至恶化趋势如何破？

程津培，有机化学家，中国科学院院士（2001年），第三世界科学院院士（TWAS，2001年），清华大学基础分子科学中心主任（2012年）。1975年毕业于天津师范学院，1981年获南开大学硕士，1987年获美国西北大学博士，1988年到南开大学工作（1995 - 2000年任副校长），2000 - 2008年担任国家科技部副部长，现任全国政协常委，教科文卫委员会副主任等职。

科技评价看起来简单，却多年原地徘徊，甚至有恶化趋势。以量化指标作为考评的主要依据已经越来越普遍化。有人说，其存在有一定的合理性，毕竟是一个客观的指标体系，能减少争议；也有人说，简单化的指标不足以衡量多样化的科研，甚至由此带来的学术不端，人才失衡，转化乏力，给国家带来了损失。如何直面问题，获得解决方法？

《知识分子》专访了曾担任科技部副部长的程津培教授，请他从历史，现实出发谈一谈科技评价，改革的难点与良策。

南京大学当时起了一个带头作用，早期的影响基本是正面的，效果比较明显。上个世纪末，当我们国家的基础研究已经取得相当进展但在国际上的学术影响还很低的时候，有必要通过国际学术平台把成果推介出去。当时，很多人都不太清楚SCI，南京大学对这个比较敏感，规定了研究生要有几篇SCI文章的要求才能毕业。

其他学校逐渐地效仿，有一些还有一定的物质奖励来激发积极性。到这个世纪初，我在科技部分管基础研究的时候，就开始考虑有必要纠偏。当时有一个基于文章发表数量的单位排名，被广泛用作看待学术水平的主要依据，这种单纯以论文为导向的评价方式必须改革。2003年，科技部出台了两个文件，一个是以科字口五部委名义发的《关于改进科学技术评价工作的决定》，另一个是与之配套的《科学技术评价办法》。

文件规定不再公布单位排名，政府不再组织鉴定，评价中不能滥用国际领先、国际首创、国际先进等不实之词；另外，要重视质量，不要光追求数量等等。在研发的整体链条上，对不同阶段，不同功能部位都得有不同对待，要求实行多元化的分类评价等等，当年就已经提出来了。现在网上仍能查询到这些文件，其中的主要提法到今天仍不过时。

你的意思是没见效果？的确是这样。当年看到的一些弊病今天仍旧存在，甚至更为严重。主要问题是政府职能中没有明确这归谁管，属于谁的责任。执行上也没有针对性的机构和监察手段，所以只能止于发文和宣传。另外，科技部官员主要习惯于项目管理，像评价这类受累不讨好的“虚活儿”，没人爱管，这个你懂的。

针对不同对象做实事求是的分类评价，是需要增加时间和人力成本的。

像同行评议，小同行之间大家相互熟悉就比较容易做，反之就不好办。比如说，基金委一下拿几十个基金申请送一个专家评，有的他可能懂，但多数他并不真正内行。这么多的材料，在很短时间要拿出恰如其分的意见，的确很难。我本身也是学者，知道专家在评价上的实际困难，有时不得不靠数数，毕竟数数来得快，也不失为一种依据。久而久之，就成了习惯。别的国家为什么不那么依赖数数呢？

一是评价时长比较合理，不像我们那么短；二是政府也没那么多钱，没搞那么多评估。反观我们，今天“211”，明天“985”，之后再来“双一流”，还有“重点学科”、“优秀博士论文”、各种基地、奖励、人才头衔等等，名堂很多，后面都是跟着钱。政府直接分配资源，要找专家，这不是司空见惯的事吗？但是，它造成了由政府主导的评价。其他国家没有那么多政府直接配置的资源，对科技类的评价，主要是由学术共同体来承担。

而我们政府配置资源的事太多，而且催着要尽快评完，这就造成专家们疲于应对，不靠数数根本无法完成。所以出现了一种怪现象：政府说，我可没让你数数！专家答，还不是你们逼的？

这次“双一流”没有动员所有的学校一起申报、评审，没有像以前那么折腾，还是有进步。以前搞这种事情都挺折腾的，报材料、考察、评估、座谈会一大堆，电话、短信打招呼，专家、校长搞接待，十分热闹，不正之风从滋生到蔓延直至盛行。

还出现了一个怪说法：不打招呼就是对评委不尊重，谁不打（招呼）必吃亏！现在这么大的事倒还平静，依据的主要是以前的长期观察和信息积累。当然，这次也不是完全没有意见，不很客观合理的选择也是有的。但这算是一次改革尝试，交点学费也难免。跟以前的全方位折腾比起来，还是利大于弊，不足之处，仍然要靠进一步优化改革来完善。

是这样，已经开展了将近一年，不久前还以此为专题上了政协双周协商会。

我们想，冰冻三尺非一日之寒。既然整体上的评价改革有难度，就不要搞齐步走，我们想先看看一些已经冲在“双一流”最前列的学校能不能更有担当，在评价改革上更负起责任？比如，可不可以开辟“特区”，进行改革的探索。研究所当然也不要置身其外。目的就是要打破论文桎梏，培育有利于重大原创研究和形成重大技术突破的创新土壤。

比如上药所做了一个“同等待遇”的有益探索，对搞创新药物研究的团队，主要不考察文章发表，而是看能不能获得临床批件和新药证书。前者给予一个教授和一个副教授晋升指标作为激励，后者则更是各为两个晋升指标。这样就更好调动了各阶段相关研究人员的积极性。但这个特殊政策是谁批的？可以说是他们自己找主管部门中科院要的，这显示了中科院的责任担当。

如果各个相关职能部门都能有这样的责任担当，都能给下面松松绑，甚至鼓励、指导、监督下属单位做科技评价的改革，那真是创新驱动发展之幸、民族振兴之幸。

最近这两年政府实行了一系列科技方面的改革。这中间，就包括建立第三方评估机构。但是，不可能一蹴而就，可能会有一个过渡期，科学共同体要尽快强化自己的能力建设，以便更好地接受政府委托的评价服务。否则，改革就成了换汤不换药。

科技部，教育部等部门以前都有一些下属的事业单位协助主管部门承担这类评估，已经存在了许多年，积累了一些专业经验。现在的问题是如何改造，如何与科技共同体相融合。上一轮改革之后，政府部门可能在这方面下的功夫不够，科技界总觉得跟以前没什么变化，对政府产生很大意见。而政府总觉得科技共同体就你目前的评估能力还担当不起这样的责任，现在有些事不敢放下去，这是个原因。可不敢放下去，就成了换汤不换药。

改革前科技部和教育部有自己的下属事业单位，协助政府做各种评估，这个系统就已经存在很多年了。现在的办法就是将这些单位跟原来的系统脱钩，改造成接受政府委托做第三方评估的单位。这样一来科技界的感觉就是你们有什么变化？——由原来是代表政府部门做事，现摇身一变为代表科技界，恐怕科技界也不太认。

其实高考也是拿一个指标来衡量，也有不少争议。

不过，科技评价工作比高考复杂得多，失误率高，搞错了方向对国家未来发展危害巨大。科技评价中有很多不同类别，有做基础研究的、技术的、服务的、转化的，如果都拿一个尺子来衡量，就会造成不平衡，也会带来学科失衡——某些方面集中了过多的人，产生了很多没有多大用的文章；有些学科上或者国家需求上特别需要加强的地方，倒流失了大量人才。量化指标的导向主要针对于文章。

当你判断能力不足缺乏依据时，数文章就很简单，久而久之形成了文章依赖。所以就出现了一个怪现象：政府说，我可没让你评估时数文章；专家说，还不是你逼的，不数数活儿哪干得完？对于跟踪型的研究，（文章）就来得快；要是领头在前面摸，很多年才能磨出来一个，也许还出不来。但是，你跟着，靠群狼战术，在某些方面很容易就把别的国家超过去，其实也就是文章超过了。但是，知其然不知其所以然。

以牺牲重大原创研究为代价，失去国家整体超越的创新能力，得不偿失。所以不能只图一时面子好看，这就是导向的问题。总体来讲，（过分强调量化指标）对科技工作十分不利。转化，平台建设没有人做了；长期的、十年磨一剑的工作没人做了，而一些特别原创的，小众型的工作被埋没。一二十年下来，就积累了大的危机。

这种错误导向，不光影响到个人，还影响到国家整个的科研链条，学科与人才的结构逐渐变得不合理，影响到国家未来的发展，这是我们着急的。所以，一定得把这匹野马往回勒，想什么招呢？我们就想在大学开特区，这些高水平的大学还跟一般的大学一样只是去比拼文章，你就没品位了。顶尖大学要更有责任担当。

还在等待，因为要做尝试，总是有难度的。

现在有的部门在评估中还是把学校拿多少经费，发多少文章、有多少顶人才帽子看作最主要的指标。所以基层要改革，还是需要上边先松绑，当然也可以相互促进。另外，现在有头衔、没头衔的差距很大。没有头衔的就拼命多发文章，有头衔的就比钱多少，都是在数数。希望校长们得尝试改变方式，要让那些没有帽子的，也给一个相应的待遇，不能对同级人员在待遇和条件上差太多。

不数数的话，学校的领导和职能部门要有担当了；专家、教授们也要有一定的担当，要出于公心来评价。人家国外不靠数数也可以在那儿评价，咱们国家怎么放弃了指标体系就没法评价了呢？我们以前没指标的时候是怎么评价的呢？这些都需要学校下功夫，我们建议就是各单位一把手必须抓这个，先设特区。

很少，现在还是在号召阶段。我们希望一些有条件的高校率先进行改革。我设想，当然可能不见得完美。

首先是基层单位要有想法，基层单位有想法就得有人鼓励他，有人支持他。不然做了半天，体系不支撑，只是单独往前走，教育部还在那儿数数，那不行。如果不数数，你仍然得认可我是重点学科，照样给重点学科的钱。政府是服务的，应该少管点，让共同体去管。这时候校长压力也小了，不用整天搞评估。现在教育部做得比较好的是，这回“双一流”没搞大面积的评估，没有折腾人；还有把优秀博士论文这个评估也拿掉了。

由政府主导的评估越少越好，像诺贝尔奖，完全是社会的奖项。如果诺贝尔奖搞错了，那就办不下去了；要是搞好了，那就留着，大家都认可。

现在是虚的，因为政府把大的评价基本全包了，共同体自主的少之又少。但我们的样板是国际化的，国际上有很多共同体都很有效的在运作。这些工业化的国家，几乎所有的评价都是交给共同体在做，只有我国是唯一的一个例外。当然除了中国，还没有哪个国家是政府主导那么多的资源的。

不是说这应该是虚的，是因为你以前没让它实，问题是在这儿。但是，现在又没有办法让它一下子就实现，这得有过渡。过渡怎么弄，大家要研讨，形成一个共识，我们慢慢试着做，把共同体内部自我的约束机制建立起来，这种共同体不要太功利化，就是为科技界服务的。包括基金委也不要功利化，如果基金委也是这样的一种机构的话，我们也要求把政府色彩往下压，主要是服务于学术发展的。然后，学术共同体的力量要加强。

它应该是一个比较公正，中立的第三方机构，不属于科技部或教育部。美国基金会的人比我们多了好多倍，项目又比我们少了好多倍。我们是20万的项目申请量，申请项目在三月就全交上去，再来一个多月就全都审完了。他们的项目申请远少于我们，评审时间远长于我们，加之基金会专业程度高的人数比我们多得多，在评审质量上自然会好。美国的人力成本这么高，都舍得花那么多人在那儿进行评估，我们该怎么改，不是挺清楚嘛。

如果学科里面的人都搞基础去了，搞表面的跟踪模仿去了，那不行。科技部或者教育部看到这个情况，那么培养人才就不均衡，就得管理调节。我们曾到天津去考察协同创新中心。化学和化工产业，很多人都愿意做化学，因为发文章快。那化工谁来做？产业谁来做？不做不行，国家很需要。协同就是大跨度，跨学术主体的，跨学科的，甚至是跨行业的。从学术跨到企业去，本身就有企业参与。

像中石化、天津的大化工，又有天津大学的最好的化工学科、南开的化学学科，加在一块没有产生化学反应，那怎么办？得出特殊政策。他们的校长就在那儿商量，必须有政策，必须探索，如果没给政策，那就自己创造，自己探索行不行？如果各个校长们想明白了，有担当，那就有主动性了，一把手好好抓，抓改革。评价的改革如果不从一把手做起，谁都弄不动。搞转化的，搞化学、化工结合的，就给奖励，给资源。

他们已经要来了，在内部二次分配的时候，校长们都是有一定的资源的，无论纵向，横向的。所以，怎么弄这一块，他们校长到一块开始琢磨这个事。该教育部管、科技部管的，他们去管；该大学自己做的，大学去做。国家领导肯定是希望我们这样做的，如果不这样做，就影响国家的前途了。习近平主席在去年的科技三会上讲了要改革评价制度，讲了要推行分类评价，根据贡献、绩效，不同的种类进行分类评价，讲得很清楚了。