作为一名视网膜医生,给病人看片子是张康日常工作的一部分。不过,虽然必须,他觉得一个经历了多年医学院学习和职业训练的医生做这样的事情显得有点“大材小用”。多年以来,他一直在寻找某种简便快捷的方法,能把医生从这种有点机械和枯燥的劳动中解放出来。直到人工智能的复兴,深度学习的到来,他看到了曙光。
黄斑变性和糖尿病视网膜病变是两种常见的眼病,如不及时就诊治疗可导致永久失明。而诊断依赖于一项叫做光学断层扫描(optical coherence tomography,OCT)的技术。用该技术得到的片子具有一定的图像模式,而不少图像模式识别的问题已被深度学习所解决。
在2月22日最新一期的《细胞》杂志封面上,报道了来自广州妇女儿童医疗中心和加州大学圣地亚哥分校(UCSD)的张康教授与合作者用10万张光学断层扫描图片训练了一个卷积神经网络(Convolutional neural network)模型,可以有效地诊断如上所述的两种眼病:在30秒的时间内就可以做出决定,病人是否需要做治疗,而且准确率超过95%。
为了显示该系统在其它常见病,其它片型(如X光片)上的能力,研究者还把它用到诊断儿童肺炎上。通过看胸腔的X光片,该系统可以区别出是病毒性还是细菌性的肺炎(病毒性肺炎主要采取支持,保守治疗,而细菌性肺炎需要迅速开始抗生素治疗),准确率超过90%。这说明这个系统具有潜在的好的适应性和通用性,可以看不同类型的医疗影像,无论是CT还是核磁共振。
此外,与6位人类专家进行比较后发现,该系统的各项指标堪与富有丰富临床经验的医生相媲美。
未来是否会产生一个AI“全能”医生,在各个方面达到甚至超越专科医生,这对未来疾病的筛查和诊断会产生怎样的影响?本刊为此专访了该研究的通讯作者张康教授。
我在美国行医二十多年了,发现转诊的效率很低,患者从普通医生转到我们视网膜专科医生进行诊断治疗,一般要两三个月,这样会耽误了黄斑变性和黄斑水肿的治疗最佳期。因为看片子就是一个模式识别问题,我就想到是不是可以用人工智能来促进从诊断,转诊到治疗方案制定的全过程。
另外,在美国的边远地区存在医疗资源不均衡分配的现象,中国,非洲,拉丁美洲更是如此。很多患者因为没有及时诊断,本来可以治的眼病造成了不可逆的失明,这是一个很大的遗憾。这几年,虽然人工智能在其他领域快速发展,但在医疗方面的应用需要看准方向进行突破。作为一线医生,我们最清楚最急需解决的问题。因此好的AI团队需要有医生或医学背景的人参加,这就是我们的契机。
非常大,因为中国的人口基数大。黄斑变性患者估计有三四百万,糖尿病视网膜病变就更大了,我估计这两个加起来,大概会有几千万人。这两个是非常大数量的致盲的病。由于人口老龄化和全球糖尿病的上升,这些疾病的流行率可能会随着时间的推移而进一步增加。
从医生的角度,必须有很专业的人工智能,图像处理的研究人员参与才行。
说老实话,这次我们将深度学习成功应用到眼病筛查,肺炎诊断上,就是因为谷歌搭建了一个很好的底层技术平台,我们等于是站在巨人的肩膀上,写了几个有关医学图像新的程序,把眼科和胸科诊断做到了世界前沿。从整个人工智能在医学上应用看,必不可少的是算法和平台,中国需要像谷歌一样花大力气去开发。人工智能的硬件还不是我们的特长,但从发展趋势上,需要有实力的人工智能团队来做这个事情。
我们团队是一个综合性的团队,有很好的计算机人工智能的专家,结合加州大学的超算中心,再加上高通的基础研究人员,所以我们很快走到了前面。此外,我们的医学背景也能让我们及时找到医学上很迫切需要解决的问题。
我们的文章和以前AI应用到医学上的研究有两点不同:第一,我们用了迁移学习的技术,能举一反三学习新知识,这就像小孩已经学习了很多东西,有了一个基础,再继续学习专业的东西就比较容易了。对本项研究来说,学习了眼科的技术,再学习X射线的胸片的能力就会有很大提高。第二,迁移学习是提示AI专注学习一个东西,不需要考虑其他,这就可以把训练需要的数据量减少很多。
是的。
标记大量高质量的图片实在是太难了,我一直在想好的解决办法。ImageNet已经有几千万张的各种日常生活中的照片,先在此处学习完后,可以让AI系统有一个一般的概念,然后再把它引入到医学图像的识别。基于这样原理的学习叫迁移学习,也是没办法的办法。
因为开始的话,不可能有很多高质量的数据;标记100万的图片,要太多时间和成本,不现实,但用迁移学习的话,就能用10%的数据(10万)在较短时间内,也达到准确的目标。
即使是标注10万张的图片,也是一个蛮大的工作量,而且需要有医学背景的专业人员去做,我们团队的医学生,研究生,住院医生,包括我自己和我的同行资深专科主任医师都做出了贡献,花了近半年时间。广州妇女儿童中心也有一个AI团队,我们有很紧密的合作,把迁移学习放到小儿肺炎的诊断平台上。整个研究做了2年多。
是的。但这也要看图片复杂程度和有多少个特征。如果特征很复杂的话,片子太少不会达到很好的效果。肺炎的研究,这次能模拟出这么好的结果,我们也是很惊奇的。因为我觉得肺炎比眼病更加复杂,这也说明了迁移学习在相对小样本上的突出作用。
是的。能拿到非常好的数据的话,才能知道什么地方算法上有什么问题,通过AI反复计算来达到好的效果。中国医院有大量病人的数据,但是如果没有经过纯化,没有高质量标注过,这样的数据直接输入计算机是没有好结果的。所以,我们有一个很大的团队一直在很努力把数据做好,这也是我们成功的一个重要原因。肺炎的片子来自广州妇女儿童中心;眼科片子来源于不同地方,有美国的,有中国合作单位的,如同仁眼科中心,上海第一人民医院。
另外,此前AI的文章,一般只是做一个诊断,我们的AI有很大的进步,不仅诊断,而且可以做转诊意见,告诉医生和病人,是不是必须马上去看病,比如是不是急性细菌性肺炎,是不是有黄斑变性和黄斑水肿,并能够建议病人需要做什么治疗。
黄斑变性和黄斑水肿现在最主要的治疗方式是通过注射一个叫做抗VEGF(血管内皮生长因子)的药物。这样的治疗现在的评判标准就是要用光学断层扫描,以前都是要靠视网膜医生盯着图片来看,现在交给人工智能,并能很快的完成这个任务(30秒钟),然后给出一个需不需要治疗,需不需要转诊的建议,而且给出的这个建议和我们训练有素的视网膜医生给出的建议没有区别。
这是一个很好的问题。
在边远地区,如云贵川甘等,很多农村和贫穷地区是缺乏医疗资源的,如果能把机器和算法直接放到那些地方的话,就可以大大提高筛查的效率。另外,很多病人一点小病就往大医院跑,所以现在大医院人满为患,医生日常看病负荷太高。我们中国的糖尿病病人实在太多了,视网膜病变又是最常见的糖尿病并发症。我们有几百万,甚至上千万的糖尿病视网膜病变病人,都面临着失明的危险。都需要看医生检查,这么大的人流怎么办?
如果把AI机器放到大医院里,它能够帮助医生先筛一遍。因为95%以上的病不是非常严重的疾病,不需要手术,只需要观察。如果AI给出一个诊断的话,对转诊分流能起到一个巨大的减压作用,让医院和医生腾出现有的宝贵时间和资源用于最严重、最需要的患者。
不需要,目前拍OCT片子很快,2分钟就能拍好,而且现在已经有自动拍片的机器了,不需要人工,所以这都不是太大问题;耽搁的时间主要还是在人工阅读片子,做出诊断这一块。从这个意义上说,这项技术对疾病的防治和治疗会带来深远的影响。
这是有一个让人类信任AI的过程。现在大家对AI还有一定顾虑,就像无人驾驶车,大家怕万一出什么交通事故。通常AI是一个黑箱。这就是为什么我们在我们的算法里加了一个遮挡实验(occlusion testing)来解释为什么AI做出此决定,以增加医生和病人对AI系统的理解,揭示系统凭什么证据做出某个诊断,增强对AI的信任。我觉得现在AI是一个医生的辅助手段,不能代替医生,但确实能够帮助医生减轻很多负担。
就是把图像分成500块,一块一块的遮挡,观察遮挡哪一部分后诊断就不准确了,以此知道哪个地方对诊断是很重要的,那个地方通常就是病灶所在。
第一个,我们想继续用更大数据规模做。
迁移学习尽管已经达到了很高的准确性,但还不是100%,我们希望让系统通过更多的学习,拥有更丰富的经验,判断更准确;第二,我们想加更多的眼疾,让系统变成一个全能的AI医生,更好的辅助眼科医生的诊断治疗;第三,目前我们在美国和拉丁美洲国家地区进行小规模临床应用,我们希望做好了以后,可以应用到中国的边远地区起到筛查的作用,或在繁忙的三甲医院能帮助做一些转诊分流,辅助我们的医生。
从理论上讲,可以训练一个全能的AI医生。我不敢说无所不能,但针对常见病,肯定是有明显的优势。因为一个即使是很聪明,很努力,精力旺盛的年轻医生,他的记忆力和工作时间也是有限的,而电脑是无限制的。
人工智能和医生的关系是相辅相成的,我并不觉得它会取代医生。因为行医有很多其它因素在里面,不仅是读片子。人工智能在医疗行业里面能走多远,还是一个未知数,如果用好的话,能减轻医生负担,协助我们为患者作优质服务。另外,病人不是机器,人和人是有情感的,医生除了给病人诊断治疗外,还需要从精神上安抚病人。我们作为医生不能百病都治好,但一定可以给病人精神的安慰,我觉得这一点AI要取代医生,还有很远的距离。
我觉得人工智能是一个新兴的领域,特别是在我们中国这个患者很多,医疗资源很少的情况下,有特别重要的地位和价值。因为这个领域一直是由几个大的IT公司垄断的,如果形成对数据和技术的封锁,也许对AI在医疗行业的顺利发展应用造成限制,我们很高兴作为一个医学学术单位,能占领这个重要高地,同时把数据和算法开放给大家,让同行能使用这个平台和数据,推动这个领域继续快速发展。