100多本科学期刊从网上消失了

作者: Diana Kwon

来源: Nature自然科研

发布日期: 2020-10-22

从2000年到2019年,已有176本开放获取的期刊从互联网上消失,另有900本可能面临消失风险。这些期刊的消失主要由于出版商停止支付网页费用或学术机构在线平台更新时被遗漏。数字文献保存项目如LOCKSS、CLOCKSS、Portico和PKP PN等旨在保护这些期刊,但仍有上百本期刊被遗漏。研究团队通过手动收集历史数据和检查保管注册中心,确定了这些消失的期刊。

研究人员发现,从2000年到2019年,已有一百多本开放获取的期刊从网上消失了,还有几百本或也面临着消失风险。学术期刊本该提供持久的科学记录,但是根据8月27日发布的一项分析,在过去的20年里,已有176本开放获取期刊——以及其中发表的论文——从互联网上消失了。“确实不应该有科学出版物的衰退或损失,尤其是那些在网上开放的期刊。

”Mikael Laakso说,他是赫尔辛基汉肯经济学院的一名信息科学家,也是上述发布在arXiv预印本服务器上的研究的共同作者。他和同事们发现在2000年到2019年之间,有176本期刊从网上消失了。其中一半以上是人文社科期刊,当然也有生命科学、健康科学、物理科学和数学领域的期刊。有88本期刊属于某学会或研究机构。

这项分析还发现了900本目前仍然在线但似乎已停止发表论文的期刊,它们可能消失于不久的将来。佛罗里达国际大学的图书馆员Elizabeth Lightfoot表示,这项研究以“强有力的案例”,展示了在线期刊的脆弱性。Laakso说,期刊从互联网上消失的原因有很多。比如,出版商停止支付网页费用,或者期刊原本托管在属于某学术机构的在线平台上,但是在站点或服务器更新时该平台被遗漏了。

期刊应该在发生这种情况时保存数字档案。1999年斯坦福大学图书馆发起的多备份资源保存项目(Lots of Copies Keep Stuff Safe,简称LOCKSS)便是为了确保当出版商不复存在时,其出版物依然可用。LOCKSS的运行方式是:对项目成员图书馆的服务器上所存储的内容进行多重备份,成员图书馆为此支付一定的年费。

类似的项目还有CLOCKSS、Portico和公共知识项目的保存网络(Public Knowledge Project’s Preservation Network,简称PKP PN),它们都是在过去20年里出现的,成本和覆盖面不尽相同:有些和图书馆合作,有些和出版商合作——PKP PN之类的服务对期刊免费注册。目前有上万本期刊包含在这类保存项目中,但是Laakso说,仍有上百本期刊被遗漏。

上述研究的作者之一、柏林自由大学的博士生Lisa Matthias说,要确定一本期刊是否真的在网上不可用是一项挑战,因为没有哪一个数据库追踪开放获取期刊的动向。开放获取期刊目录(Directory of Open Access Journals,简称DOAJ)一类的数据库不会追踪已停止发表论文的期刊——而停止发表或停止网络维护的期刊一般都不会声张。

为了搞清楚有多少期刊已经消失了,研究团队手动收集了多个期刊目录的历史数据,包括DOAJ、Ulrichsweb和Scopus;之后再检查是否有期刊被列在保管注册中心(Keepers Registry)上,该中心会追踪已被纳入数字保存项目中的期刊。

最后,他们到互联网档案馆(Internet Archive)的网站时光机(Wayback Machine)上查看现已下线的期刊的网站快照,确定它们最后的发表时间以及网站内容最后可访问的时间。如果期刊内容只剩不到50%能在线免费访问,那么这些期刊就被视为“已消失”(研究人员承认部分期刊可能以纸版形式存在或可付费访问)。

在176本已消失的期刊中,绝大部分是在变得不活跃后——停止发表论文——5年内消失的。约三分之一是在最后发表论文后的一年内消失的。研究人员使用这样的“生命周期”进行评估,发现另有900本不活跃的开放获取期刊可能面临消失的风险。Laakso说订阅型期刊没有包括在这项研究中,因为付费墙的存在意味着他们需要采用不同的方式来收集数据。

他补充表示,因为这一点以及其他限制,他们的研究可能低估了已经消失的期刊数量。“你确实很难断言某个东西在什么时候绝对不存在了,但是我们已经尽了全力,”Laakso说,“我们希望未来能有更加细致和自动化的方式来追踪检测。”LOCKSS项目的代理经理Thib Guicherd-Callin说,有些期刊没有被现有的文献保存服务覆盖到也不稀奇。

虽然许多团队已经在使用开源的LOCKSS软件,但是为启动数字文献保存计划所做的工作仍然“极度缺乏资金,”他补充道,“保存这些面临风险的作品的意愿是有的”,但是很少有机构会投入必要的资源来鉴定那些出版物,确保它们被收录在某个数字保存计划中。Matthias说,确保不活跃期刊不会消失的责任应该由出版商、作者、图书馆员和文献保存服务共同承担。Lightfoot也同意说统筹协作是必要的。

但是,她也表示,“这项工作究竟该怎么做,该由谁提供资金支持,这样的双重挑战使前面的道路显得模糊不清。”

UUID: 65b1c899-a87c-4699-9fc6-dc203305bdbb

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2020/2020-10-22_100多本科学期刊从网上消失了.txt

是否为广告: 否

处理费用: 0.0044 元