若论文数据库也遭美国“卡脖子”,中国如何应对?

作者: 叶水送

来源: 知识分子

发布日期: 2021-05-21

在中美关系紧张的背景下,中国科学家和科研机构对美国主导的论文数据库PubMed的依赖性引发了担忧,特别是在PubMed可能被限制访问的情况下。中国正在努力建立自己的科研基础设施,以减少对外部资源的依赖,并加强本土创新和技术自主。

中国科协生命科学学会联合体秘书长王小宁在4月中旬的一次座谈会上表示,公共论文数据库PubMed“卡”了国内两家科研机构的“脖子”,具体是哪两家,他并未点明,且未说明具体原因。在中美关系紧张之际,不仅国内工业界在热议哪些技术被卡了脖子,中国科学家也在密切地关注和讨论:如果科学界也像芯片技术那样被卡了脖子,那该怎么办?

从实验设备、试剂耗材,到实验动物模型,再到数据库、软件工具,我们还能自主地从事科学研究吗?

4月19日,中国科协技术协会生命科学学会联合体秘书长、免疫学家王小宁在一个内部座谈会上对科学界的“卡脖子”问题表示担忧,“如果美国政府不让我们使用PubMed,我们该怎么办?”据了解,目前国内有数家基础研究机构已经不能正常使用PubMed,“他们选择性地给你封掉”,王小宁表示。但“我们查文献基本靠PubMed,”王小宁表示,中国现在既是PubMed最大的原始数据的提供方,又是最大的数据购买方。

上世纪50、60年代,中西方隔阂很深时,中国科学家的论文曾被拒绝发表在西方英文期刊上。今天,我们不得不面对的一个假设是:如果中美在基础科研领域的关系进一步恶化,那么PubMed中断该怎么办?美国主导论文索引数据库PubMed是全球科研人员使用的免费论文引文数据库平台,生物医药领域的科研人员发表论文后,一般都会将论文上传至PubMed,从而方便更多的人检索,提高论文曝光以及下载量。

中国生命科学乃至整个科研领域都高度依赖这一数据库平台。

PubMed数据库由美政府资助创建及运营,自1996年成立至今,PubMed积累了大量论文数据。由于它免费供全球科学家使用,加上建立的时间较长,全球各地很多科学家养成了习惯,如果想检索论文会到其上面检索、搜集论文。类似PubMed这样的论文数据库还有Web of Science等,但PubMed凭借免费、数据量大,赢得了大量的用户。

根据其官网介绍,PubMed由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)开发和管理,NCBI是美国国立卫生研究院(NIH)的一个下属单位,而NIH直属美国卫生与公众服务部,其主任由美国总统直接任命。2018年,NIH成为调查在美华人学者与国外合作的“急先锋”。

中国为何没有自己的PubMed?

公益属性强,没有盈利的诉求,不仅建起来花钱,而且每年都需要投入重金运营,因此这块“不赚钱”的业务此前不被国内看好。当然,中国在这一领域也并非空白,此前也建过类似PubMed的一些网站,如1989年建立的中国科学引文数据库 (Chinese Science Citation Database)。然而它们不仅没有获得国内科学家的认可,更不用说国际科研群体,目前处于一种被动运营的状态。

而国内用户常用的中国知网,论文并非由作者自己上传,而是由平台来上传。而且,中国知网只是对自己收录期刊内容的一个搜索,别的内容搜索不到,这一点也限制了其论文的数量。因此,在很长一段时间,国内都没有一个自己的持续投入、获得国际认可的自上传论文数据库平台。

事实上,建一个类似PubMed的数据库在技术上难度不大,主要是肯花资金,以及建成后注重长线运营和传播。另外,提高网站的用户体验,以及加强运营和传播显然很重要。尤为重要的一点是开放,这样网站既可以服务于中国科学家,同时也能为全球科学家提供服务,才有可能在国际上流行开来。

美国对来自中国的科研合作限制加大,美国忌惮中国基础科学的发展由来已久。今年5月12日,美国参议院商务、科学与交通委员会投票通过《无尽前沿法案》,其中一条是“参加中国资助的人才招聘计划的任何美国科学家,都将被禁止获得或使用联邦经费”。目前,法案仍需参议院审议和总统通过,但这预示着中美在科研合作上的空间即将被进一步挤压。

当前,“中美在科研领域是否也会脱钩”的话题已经摆到了台面上。如果美国定向地关闭PubMed这样的基础学术设施,会对中国科研产生什么样的影响?这也是中国学者应该思考的问题。

中国科学界正建立“白清单”机制,逐个攻关。目前,中国科学界正在自查自纠,搞清楚除了PubMed,还存在哪些短板。王小宁在上述座谈会中透露,中国科协正在建立生命科学领域“白清单”机制,对于具有“卡脖子”特征的技术进行梳理,以明确攻关方向。

然而,摆在我们眼前的事实是,大到实验仪器,小到试剂耗材、动物模型,甚至实验数据处理软件,我国依赖“进口”的环节非常多。中科院上海生命科学信息中心主任于建荣在研讨会上表示,“从基层一线传递出来的声音看,科学信息、实验动物、科学仪器设备、试剂耗材‘四要素’存在关键技术上严重依赖进口的问题。”

“实验动物也是一样,珍贵动物品系的缺失,对后续的科学研究、产业发展造成的打击无异于源头的‘截流’。”中国医学科学院医学实验动物研究所所长秦川表示,“核心技术是买不来的,不仅(只有)光刻机”。

除了硬件上存在较大的短板,我国在科研领域的软件上同国外的差距也很大,如去年Matlab在哈工大被列入实体名单后,就宣布禁止哈工大师生使用该软件,当时在国内掀起了激烈的讨论,然而我们在抗议Matlab的行为之后,只能选择继续使用它,因为没有其他的更好方案。

中科院计算所研究员包云岗去年曾撰文指出,当我们在思考如何解“Matlab被禁”这个解燃眉之急的同时,更需要考虑如何才能在未来做出像Matlab那样的工作,做出能“卡别人脖子”的技术。

中科院神经所所长蒲慕明在《自然》的一篇报道中表示,“中美关系紧张,这给中国提了一个醒”,中国应加强自给自足。在今年公布的十四五规划中,我国强调了加强本土创新,强调基础科学与工业界的联动。

事实上,针对科学界卡脖子问题的讨论并非首次,只是我们从认识到这一问题的存在到解决这一问题,恐怕还需数年之久。

UUID: bb545c9c-7a0d-43c2-8a13-1ed163a7485a

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/知识分子公众号-pdf2txt/2021年/2021-05-21_若论文数据库也遭美国“卡脖子”,中国如何应对?.txt

是否为广告: 否

处理费用: 0.0059 元