经过海量安全数据训练的机器学习软件可以提高自动化毒性评估的准确性。据相关研究人员报道,在某些情况下,机器学习软件在经过海量化学品安全性数据训练后,其预测毒性的准确性堪比(甚至高于)昂贵的动物试验。在某些情况下,计算机程序预测化学品毒性的准确性能与动物试验相媲美。
约翰·霍普金斯大学的毒理学家Thomas Hartung表示,全世界每年在动物身上开展的标准化安全性测试数以百万计,比如将某种化合物滴入兔子的眼睛以检查它们是否具有刺激性,或者用化学品喂食大鼠以明确致命剂量;现在,计算机模型或许可以取代一部分这类测试。“大数据赋予我们一种比动物试验更有效的预测工具。
”7月11日发表于《毒理科学》的一篇论文中,Hartung团队报告称,他们开发的一种算法能够准确预测上万种化学品的毒性——超出其它已公开的模型,涵盖了从吸入损伤到水域生态系统损害的九类测试。德国巴斯夫的毒理学家Bennard van Ravenzwaay说:“这篇论文让人注意到大数据的新潜力。我百分百相信大数据将成为未来毒理学的支柱。
”不过他补充表示,可能还要经过很多年才能让政府监管机构接受用计算机预测结果取代动物测试。不仅如此,涉及较复杂的损伤评估时,如某种化学品是否会致癌或影响生育,动物测试将更加难以被取代。产业界和学术界从几十年前就开始用计算机模型预测毒性。这类模型一般包含分子的化学结构、分子在体内的潜在反应以及动物测试数据或体外测试数据。
公司还会采用交叉参照方法推断未经测试物质的毒性,即将未经测试物质与其它结构或生物学类似、但毒性已知的化合物进行比较。不过,Hartung等毒理学家表示,监管机构对这类方法的认定标准非常高,倾向于采纳动物测试结果。Hartung团队为了提高其机器学习软件的性能,根据从约80万项动物测试中得到的约1万种化学品的信息,创建了一个大型数据库。
这些数据最初是由赫尔辛基欧洲化学品管理局依据2007年的REACH法规收集的,REACH的全称是化学品注册、评估、许可和限制,该法规要求相关公司登记将在欧盟销售的大部分化学品的安全性信息。截至2018年5月,欧洲化学品管理局收到了逾2万种化学品的信息。他们将这些数据公开出来,不过数据格式不方便计算机进行分析。因此,Hartung团队在2014年将可用数据提取出来,录入一个机器可读的数据库。
这导致Hartung与欧洲化学品管理局产生了法律纠纷,因为后者认为这些数据所代表的研究细节属于当初开展测试的公司。2017年,Hartung同意不公开自己的数据库。欧洲化学品管理局则通过单独的公共文件,另行公开了关键研究结果——并非全部数据。Hartung的软件采用交叉参照方法,对比新化学品和与其密切相关的化合物,通过参照已知化学品的特性,推测新化学品具有毒性的可能性。
Hartung说该软件实际上是对毒理学家评估新化学品的模仿,只不过是以一种自动化的方式。他的数据库分析还暴露了动物测试结果的不一致情况:反复测试相同的化学品可能产生不一样的结果,因为不是所有动物都会有相同的反应。因此,他说对于某些类型的毒性而言,软件预测比动物测试更可靠。上述论文的共同作者Craig Rowlands说:“这在5年前是无法做到的。
化学品法规已经使大量化学品的毒理数据和物理特性数据公之于众。”他同时是美国安全科学公司Underwriters Laboratories的科学家,该公司正在对Hartung的软件进行商业化运作。Hartung以及其他共同作者担任该公司的顾问,参与利润分成;他们已经和其他提出要求的研究人员及政府机构分享了基础数据库。
另外也有其它一些研究人员和公司正在开发用以预测化学品毒性的机器学习算法,不过他们尚未发表相关研究论文。化学品安全监管机构正密切关注他们的动向。美国机构间替代方法验证协调委员会代表16家美国政府机构,正在开发可替代动物安全性测试的方法。4月,委员会邀请了几十支来自学术界和商业界的研究小组齐聚美国国立卫生研究院。
每支研究小组使用自主研发的软件预测4万种之前已经在大鼠身上测试过的化学品毒性的“致命剂量”。Nicole Kleinstreuer表示,将最佳软件组合起来产生了一种共识计算模型,其“性能可与动物测试相媲美”。Kleinstreuer负责协调上述工作,并且为美国国家毒理学研究规划处开发可替代动物测试的毒性测试方法。美国环境保护署计划在今年晚些时候在线公布共识模型,供免费下载。
2016年美国的一项历史性法规规定美国环保局有权要求化学品在上市前通过安全测试,有鉴于此,美国机构积极推广非动物测试方法。6月,美国环保局公布了一项战略性规划——推广非动物测试方法,包括软件。在欧盟,欧洲化学品管理局也鼓励相关公司尽可能在实验室细胞分析的基础上,采用交叉参照的方法测试化学品毒性,避免采用动物试验。
Rasenberg认为最新论文代表了“一个好的开端”,但是“从科学角度来看,还有大量的工作要做”。他补充说:“没有人想要开展动物试验,但是目前计算机还无法完成所有的毒理分析。”