人工智能(AI)为医学发展带来了巨大的变革,挑战也随之而来。一方面,AI的应用赋予医疗实践新的可能性,另一方面对AI可靠性和可用性的考量也成为AI进入临床绕不开的议题。最大限度发挥医疗AI优势,规避和解决可能存在的问题,是现今学术界和工业界共同希冀。
2022年9月14日和15日,由NEJM集团(《新英格兰医学杂志》出版方)和嘉会医学研究和教育集团(J-Med)联合主办的AIMS 2022年会“实践中的医学AI:扬长避短,勇于担当”在线成功举办。会议汇聚了NEJM编辑团队和中外医学AI领域的优秀代表,共同探讨AI临床试验、AI可信度、AI应用实例等话题。
《NEJM医学前沿》副主编赵剑飞博士首先介绍了AIMS系列研讨会的初衷和历史。
随后,NEJM副主编、《NEJM医学前沿》执行主编、北京大学未来技术学院院长肖瑞平教授在开场致辞中指出,人口老龄化加剧为医疗系统带来了沉重压力,尤其是在当今全球医疗资源分布不均情况下。AI带来的医疗创新也许能从根本上缓解日益繁重的医疗系统压力,但AI必须是安全可信、符合伦理的,同时AI必须能够辅助提升临床试验的效率和准确性。
AI潜能的实现需要多方合作,需要临床医生、科学家和企业家共同努力,而AIMS论坛为这些不同领域的专家提供了学术交流平台。
随后,NEJM主编Eric Rubin教授,上海交通大学医学院院长、中国工程院院士范先群教授,上海交通大学医学院附属瑞金医院院长、中国科学院院士宁光教授为本次会议致开幕辞。
Rubin教授表示,NEJM一直致力于改善患者获益,AI作为一种新方法,有望改变临床研究的开展方式,成为将来临床试验中的基础方法。他希望NEJM能在这一过程中做出贡献,成为AI社区的一份子。范先群教授介绍了上海交通大学医学院在AI建设方面取得的一系列成绩。他认为,近年来蓬勃发展的AI技术将对国民经济和科学技术产生深远影响,数字化、网络化、智能化的医疗设施及解决方案有望改变传统医疗模式。
宁光教授指出,随着全人群慢病发生率的升高,医疗资源匮乏成为了全世界面临的共同挑战,而医疗AI将会是解决这一问题的利器。目前,瑞金医院已经在医疗服务、医疗实践和医院管理几个方面部署医疗AI,进一步改善了患者的诊治体验。
本次会议的第一场将主题聚焦在AI给临床试验带来的变革。斯坦福大学生物医学数据科学系助理教授James Zou作了题为“AI助力临床试验,临床试验反哺AI”的报告。
临床研究对于药物开发必不可少,且通常耗资巨大,因此努力提高临床研究效果和效率是必要的。James Zou分享了自己团队的两项工作,这些工作对于使用AI指导临床研究具有重要意义。
第一项工作涉及计算平台“Trial Pathfinder”,该平台利用真实世界数据和AI模拟临床试验,辅助研究人员制定更加合理的临床研究入排标准,在保证安全性和有效性基础上,让原本可能因为过于严苛的标准被排除在临床试验之外的患者也能够获得参与临床试验的机会。另一项工作则将真实世界数据与NGS测序数据相融合,使用AI找到能够预测患者疗效的生物标志物,为患者做出更精准的治疗推荐。
英矽智能创始人、首席执行官Alex Zhavoronkov和联合创始人兼总裁Alex Aliper在随后的讲座中介绍了英矽智能打造的能够实现临床试验结果预测的端到端的AI平台。传统药物从药物发现到最终上市需要经历一个复杂的过程,投资巨大,耗时漫长。而使用AI有助于在全流程加速药物开发,甚至创造了在18个月内将药物研发推进至临床前研究阶段、不到30个月进阶至1期临床试验的记录。
inClinico多模态AI平台应用多层级数据,包括组学数据、药物结构、试验设计、前临床数据,以及来自公共平台的文本数据,如论文、基金、专利等,构建能够预测临床试验成功概率值的AI模型。两位报告人表示该模型在验证集中预测2期临床研究结果的准确率可超过80%。
《NEJM循证》(NEJM Evidence)主编Jeffrey Drazen主持了接下来的圆桌讨论环节。
Drazen教授高度认可AI在医疗领域的应用前景,他提到AI模型的构建需要数据的训练,但这些数据可能存在一些偏倚:首先,对于创新性较强领域,旧有数据对未来也许预测意义不大;其次,获取数据也许与真实情况存在偏差,比如来自真实世界的数据往往受到医生主观描述的影响。就Jeffrey Drazen提出的几点担忧,肖瑞平、Eric Rubin、宁光、James Zou和Alex Aliper展开了热烈讨论。
与会嘉宾对Jeffrey Drazen的观点表示赞同。他们认为,现在AI算法确实有其局限性,数据偏倚也是不可避免的,应该意识到,AI预测并不是万能的,而是“预测那些能够预测的”。在开发AI模型过程中,应当尽量把会导致偏倚的因素考虑进去,指导临床试验更高效地规划和执行。
本次会议第二场围绕AI可信度展开。澳门科技大学医学院副院长张康通过多个AI实例讲解,阐述了当前医疗AI应用的机遇与挑战。
他指出,当前国内外电子病历信息化急速增长,数字化医疗健康数据多样性增加,医疗资源分布不均衡,因此急需AI技术辅助,缓解当前医疗压力。他以AI眼底诊断系统、Covid-19 AI影像学诊断系统以及基于电子病历的儿科疾病AI诊断系统为例,从AI辅助、AI赋能、AI与临床医生相互影响三个方面分析了AI在医疗实践中的应用,展示了AI的应用潜能。
斯坦福大学医学副教授Sherri Rose分享了自己对于医疗AI所应满足最低标准的见解,其关注重点为医疗公平性。近年来,新的算法不断出现在医疗健康领域,旨在改善人类健康。但广泛使用的算法可能反而会对边缘化群体产生负面影响,不仅没有改善医疗公平,反而可能会对其产生损害。例如,医疗算法中的种族偏见也许会让黑人患者无法获得所需的治疗管理。现有的一些指南和提议也并没有给予道德和公允性充分关注。
因此,需要建立通用算法的最低标准,提高AI建模泛化性和可迁移性,更好促进和改善医疗公平。
NEJM编委、哈佛医学院教授Isaac Kohane表示自己对医疗AI前景持乐观态度,希望AI在临床上能有更多用武之地。
在他的主持下,澳大利亚麦考瑞大学教授Enrico Coiera、华中科技大学同济医学院附属同济医院妇科肿瘤科主任高庆蕾、西湖大学特聘研究员郭天南、Sherri Rose、张康就作者和期刊如何增加医学AI研究可信度这一主题各抒己见。Coiera教授强调研究结果可重复性非常重要。受限于不同的文化和环境,某些研究重复性不佳,所以研究者应该以更加审慎的态度对待现有研究结果。
对此,郭天南研究员认为,对于新发现的生物标志物,要保证其可信度和可重复性,就应该在临床标本中进行系统和全面评估。高庆蕾教授表示,从自己的临床实践经验来看,AI表现非常有说服力,是值得信任的。张康教授解释,他对AI的信任并不是盲目的,而是建立在对AI模型充分检测和验证基础上。Rose教授则表示,她认为所有发表的AI数据,都应该通过外部样本和数据验证,方能提高其可信度。
本次会议的第三场由NEJM副主编、香港中文大学医学院黄永坚教授主持,多位讲者围绕“夯实根基,畅想未来”的主题作了精彩讲座。高庆蕾教授讲述了将AI和大数据用于卵巢癌精准诊断的新策略。她的团队基于超过12万名患者的超声诊断影像建立了早期卵巢癌的AI诊断模型,其诊断准确性接近甚至优于超声科医生。作为企业界优秀代表,腾讯医疗副总裁吴文达以如何将AI应用于宫颈癌筛查为例展示了一个临床AI系统的搭建过程。
来自Google Research的AI科学家Katherine Heller介绍了其团队开发的一款名为MS Mosaic的APP,这款APP可以持续采集多发性硬化患者相关数据和信息,并将这些数据用于患者监测和管理。
广州医科大学附属第一医院胸部肿瘤科教授梁文华则分享了三个AI改善肺癌精准化诊疗应用实例,包括放射组学AI检测EGFR突变、整合分子和放射组学生物标志物诊断肺部结节的AI模型以及用于预测疾病基因谱的病理AI。
粤港澳大湾区精准医学研究院高级研究员韩涟漪讲述了团队关于真实世界数据驱动的智能儿科CDSS系统的工作,他希望可以通过该系统辅助做出儿科门诊的临床决策和警示高风险儿科疾病,减少误诊、漏诊并实现对门诊病历的全量自动化内涵质控。
复旦大学哲学学院教授王国豫梳理了目前医疗AI面临的六大主要伦理问题,即不伤害和有利原则(non-maleficence & beneficence)、隐私保护和知情同意(privacy & consent)、可解释性和透明性(explainability & transparency)、公平性(justice & fairness)、责任追溯(responsibility & accountability)、信任和自主性(trust & autonomy)。
针对这些问题,美国、英国以及德国都纷纷出台相关监管机制和政策,探索更有效的治理方法。我国近年来一直在不断完善对于医用AI的监管体系,并且制定了更符合中国国情的标准。王国豫教授强调:“AI影像学有着广泛的应用前景,能够为医学和人类带来进步,但是目前确实还存在一些问题,在医学伦理落地过程中,我们特别要考虑文化语境差异,既坚持规范性,又兼顾可行性。”
黄永坚教授表示,本次会议通过众位与会者的演讲和讨论,为AI未来发展方向提供了新洞见,当前AI应用还集中在影像学领域,但相信随着AI和其他技术不断成熟和完善,AI会在临床中获得更加深入的应用。
最后,NEJM国际记者Charlotte Haug总结道,虽然AI技术蓬勃发展,但其局限性仍然存在,我们需要认识到科技无法完全代替人类,找到促进人机协作的方法至关重要;同时,AI应用应当重视对医学伦理和人文背景考量。很显然,AI发展仍然“路漫漫其修远兮”。特别致谢英矽智能,皓元生物及北京健康促进会对本次会议的支持。