疾病的诊断和治疗是最为复杂的系统工程之一。随着现代诊疗技术的不断发展,医生每天从病人那里获取海量的临床诊断信息。如何从冗杂的临床数据中抓住精要并作出准确的疾病判断是每名医生都要面临的难题之一。能否通过人工智能(Artificial Intelligence, AI)配合电子病历辅助医生进行疾病诊断呢?
最近,由广州市妇女儿童医疗中心教授夏慧敏和加州大学圣地亚哥分校教授张康共同领衔的科研团队设计出一套基于人工智能的疾病诊断系统,可用于儿科疾病的评估和精确诊断。该工作于2月12日在线发表于《自然医学》杂志 [1]。
“对儿科疾病的诊断是医疗中的一大痛点。一方面,儿童的抵抗力较弱,容易罹患多种疾病;另一方面,一些儿科疾病威胁程度较大,需要尽快得到治疗。能够快速、准确地对儿科疾病进行诊断,不但可以减少患者的等待时间,还可以让那些病情危急的儿童及时得到诊治。此外,当前儿科医生供不应求,因此我们的人工智能系统对于已经严重不足的医疗资源能够起到很大的辅助作用。”论文的通讯作者之一张康介绍说。
先前已有科学家设计出深度学习(Deep Learning)程序用于影像学数据分析,并辅助医生进行眼病和肺炎的诊断 [2, 3]。在本研究中,研究人员首先将医疗知识进行整合,构建了一个自然语言处理(Natural Language Processing,NLP)模型对130万份儿童电子病历进行注释(图1)。该模型在未经过“培训”的情况下可以粗略地将临床信息进行分类。
通过资深医疗专家注释的6183份图表对系统进行“培训优化验证”后,研究人员发现经过深度学习的NLP信息提取模型对电子病历进行了很好的注释,其F1评分(反映模型综合性能)超90%,在体检和主诉项目的注释上分别达到最高灵敏度和精确度。简单讲,深度学习的NLP模型能够准确地读取电子病历记录的信息,并作出符合临床标准的批注。
那么,人工智能能否作出正确的疾病判断呢?
随后,研究人员用逻辑回归分类器(logistic regression classifiers)创建了一个疾病诊断系统。该系统模拟医生的临床诊断过程将疾病按照人的解剖系统(例如呼吸系统、消化系统、神经系统等)进行分门别类,同时可以将更为复杂的结构(例如呼吸系统)进行细分。
结果显示,基于NLP模型准确读取的数据,逻辑回归分类器对儿科疾病作出了精确的诊断:中间准确率达90%,对神经精神失调疾病的诊断准确率更是高达98%。在更深一层的诊断水平上,逻辑回归分类器同样表现不俗。
以呼吸系统疾病为例,系统对上呼吸道疾病和下呼吸道疾病的诊断准确率分别为89%和87%,而在上呼吸道疾病诊断中,急性喉炎和鼻窦炎的准确率分别高达86%和96%,对不同类型哮喘的诊断准确率从83%到97%。
同时,逻辑回归分类器对普通系统性疾病以及危险程度更高的疾病也有很高的诊断准确率,例如传染性单核细胞增多症(90%)、水痘(93%)、玫瑰疹(93%)、流感(94%)、手足口病(97%)和细菌性脑膜炎(93%)。
也就是说,逻辑回归分类器可以根据NLP系统注释的临床数据信息对儿科疾病作出准确的判断。
我们不禁要问,人工智能和医生的诊断到底哪个更加精确呢?研究人员随后运用11926个临床病例比较了人工智能系统和5个临床治疗组诊断儿科疾病的水平。参与研究的治疗组从事临床工作时间和资历逐渐增加。结果显示,人工智能系统的F1评分均值要高于2个年轻治疗组,但逊色于资深治疗组(图2)。文章指出,该人工智能系统可以协助年轻治疗团队进行疾病诊断,提升团队诊疗水平。
“相比来说,我们研究所使用的数据量还是较少的,如果有13亿的样本量,我们相信人工智能诊断疾病的精确性会更高。”张康表示,“从长远看,这套系统可以应用到儿科疾病以外的其他诊疗领域,例如成人疾病的精确诊断。
”不过,“须要清醒认识到,我们仍有很多基础性工作要做扎实,比如高质量数据的集成便是一个长期的过程,因为大数据的收集和分析需要算法工程师、临床医生、流行病学专家等在内的多领域专家的通力合作”,另外一位通讯作者夏慧敏强调说。他还指出,人工智能学习了海量数据后,其诊断结果的准确性仍然需要更大范围的数据对其进行验证和比对。
医疗领域一直是人工智能努力进军的方向,这一工作探索了人工智能在临床疾病诊断应用上的可能性,为把医生从繁杂的临床数据中解放出来带来了希望。期待人工智能医学诊疗系统未来的成熟稳定,为人类健康提供更强大的保障。