科学研究的价值在于增添人类知识,促进人类进步。因此,研究成果的重要性是依据其对于知识体系和人类发展的贡献来评判的。
科学贡献的形成途径通常有六类:(1)靠创新思想,以新的视角、框架看待和思考问题,设计实验,构筑理论;(2)靠深度追究,基于问题驱动,借助多种工具、方法,层层递进,深度挖掘获得新的发现;(3)靠类比拓展,将新思想、新方法移植于新的研究对象;(4)靠平台技艺,占有大型设备或掌握瓶颈技术;(5)靠稀有资源,譬如特有的化石、物种、材料样品;(6)靠大投入大合作,开展通常财力和人力难以支撑的研究。
在实际的研究工作中,这些创新途径也可能是相互交叉的。不难理解,一个经济先于科技崛起的国家首先通过途径(3)到(6)建立科学贡献,之后随着人才队伍的成熟和科学文化的形成,越来越多地出现依靠前两种途径取得的贡献。
许多人以为,我国较有显示度的科研成果基本上是依靠化石资源、测序平台、蛋白结构分析技术或大额经费投入取得的,但从2014年发表在Cell, Nature, Science (即CNS)上的论文来看,我国优秀科研成果的产出已经开始向依靠创新思想和深度探究转型。
去年,标注为我国科研机构的学者以通讯联系人或第一作者身份在CNS发表的文章共124篇(还有大量子刊论文未包括在内),其中研究论文66篇,综述论文4篇,其他为观点、简评、来函、政策论坛之类的短文。
在66篇研究论文中,主要依靠基因组测序、甲基化组等“组学”分析方法完成的论文有11篇,报道蛋白、蛋白复合体等结构的论文9篇,依靠化石进行古生物学分析的论文4篇,建立新型方法、途径的论文12篇,探究机理、成因的论文30篇。后两种类型约占CNS研究论文数的三分之二。我举CNS论文为例说明我国科学研究的转型,仅仅是因为这些刊物的受关注度,而并非认为只有在这些刊物发表的论文才具有重要科学贡献。
学术期刊面向一定的范围,对于原创性、先进性、完整性和吸睛度有一定要求,一些原始创新的重要发现可能因为主题和方法不够时髦、编辑和审稿人的判断力不足等原因而未能在关注度高的刊物发表。对于科学贡献的评判并不纠结于在何种刊物发表、获得何种奖励,而是依据对解决问题所起的实际作用、在学科发展中的地位乃至对经济社会的影响,关注思想的贡献、技术的贡献和关键数据的贡献。
对科学贡献的评判,作用和影响是依据,可靠性则是基本前提。有研究报道,半数科学论文的结论后来证明是错误的,还有超过半数的生物医学研究的数据甚至不可重复。我在惊讶和将信将疑中,对此陷入沉思。
就实验科学而言,一般有三类:(1)表征型,即对特征、属性进行观察、测试、分析;(2)路径构筑型,即建立或改进方法、路径,再经过表征研究证明其可行性、可用性;(3)原理探究型,即通过变量的人为改变和效应观测,对特定对象的标记跟踪、分析测试,或者借助数学工具推演、模拟自然过程,探寻相关关系、因果关系和本质特征。
前两种研究的错误可能主要来自于实验方法的局限性或材料的不稳定性,而第三种研究主客观干扰因素更多,错误的风险也更大。那么怎样提高科学结论的可靠性呢?我认为有以下几点值得注意。(1)弄清测试和运算的原理、适用范围和可靠程度。仪器、软件及其他研究工具都有适用范围和局限性,研究者要充分理解它们的原理,知道在何种条件下有何种可信度,这样才能够对结果有比较准确的解释,在可靠的范围内下结论。
(2)分清相关关系和因果关系。在同一时间、空间出现的事件有相关性,但不一定有因果关系。这个道理似乎浅显,但在某些情况下也令人迷惑。要排除其他变量的暗中影响,从正反两方面设置条件论证因果关系,辨明谁因谁果、直接因果和间接因果,而不要轻易下结论。(3)通过不同途径相互映证。测试结果可能有假象,原因分析也可能有误判,设计不同实验方案在不同层次、方面相互映证是避免落入陷阱的一项有效措施。
(4)关键数据安排不同实验者独立测试。实验者有个人操作习惯甚至操作误区导致测试偏差,还有些研究材料本身存在某种不稳定性,安排他人独立测试可减少这种错误,至少有利于掌握数据波动的范围。(5)绝不为获得发表打擦边球。在关注度高的刊物发表论文是许多人所期盼的,但千万不可通过选择性使用数据制造亮点,明知存在其他可能性却利用同行知识上的盲点使论文获得发表。
有的论文大部分数据都是可重复的,但就是决定文章高度的那一两个关键数据没法重复,这让同行作何理解?
科研成果在公布之后要经受形式评价、内容评价和历史评价。第一种评价依据刊物影响因子、领域排序、论文引用等指标;第二种依据同行对研究者所报告信息的分析比较;第三种则依据被时间所检验的科学贡献。总之,科研工作者的人生价值最终是在历史的天平上衡量出的。