大多数人第一次了解IBM的机器人沃森,可能源于2011年美国热门电视智力问答节目——《危险边缘》(Jeopardy!)。当时,这个神秘的人工智能选手战胜了这个节目史上最强的人类对手。过去数年间,随着人工智能在医疗健康领域的应用成为热点,医疗领域即将准备迎来一场大变革。IBM、微软、谷歌等大企业纷纷加大投入,并取得了显著的进步。
本月,沃森正式进入中国的21家医院,并在日本为癌症病人做出诊断。也许距离我们接受一名机器人医生的“坐诊”已经为时不远。正当国内医疗专家开始尝试使用深度学习来挖掘医疗数据时,8月12日,IBM宣布其重金研发的智能认知系统沃森(Watson)已登陆中国。根据IBM宣布的计划,沃森将与国内21所医院进行合作,帮助医生为肿瘤患者制定更好的个性化治疗方案。
据IBM的消息,现阶段沃森可以对医学文献进行打分与评级,并迅速整理医患的医疗记录,提高医生的诊疗效率。沃森对海量数据进行分析,从而帮助医生为患者提供高质量、个体化的循证癌症治疗方案。它还可以为医生与患者带来世界顶级的癌症治疗专业知识。本月初,沃森帮助一位在日本东京大学医学院治疗的60岁女性患者诊断出了罕见的白血病类型。
据东大医学院研究人员对媒体的说法,沃森通过比对2000万份癌症研究论文,在短短10分钟内得出了诊断结果。
作为认知计算系统的沃森于2007年问世,它取名自IBM的首任执行官托马斯·沃森(Thomas Watson)。过去九年间,沃森不仅是智力问答的佼佼者,还推动着医疗健康、金融服务、零售和教育等行业的发展以及未来转型。
它可从各种结构化或非结构化的数据源中学习和积累知识,还可以在大数据中筛选信息,并对其进行评分。在医疗健康领域,它可以在几分钟内搜索大量的信息,给病患提供精准的诊疗方案。自2014年起,IBM公司已将医疗健康作为沃森的主打牌。
目前,沃森已经与包括安德森癌症中心(MD Anderson Cancer Center)、纽约纪念斯隆-凯特琳癌症中心(Memorial Sloan-Kettering Cancer Center)等在内的顶尖癌症中心建立合作关系。通过大数据整合,沃森正逐步成长为日臻完美的医学诊断专家。以它为代表的人工智能,将推动医疗健康领域的转型,给人类带来巨大的社会、经济以及政治效应。
沃森转战医疗健康:既上医学课程,又阅读文献。众所周知,IBM公司以前研发的超级国际象棋电脑——深蓝,具有极强的计算能力,它有32个“大脑”,每秒钟可以计算2亿步,存储了一百多年来超过两百万局优秀棋手的棋局。然而,深蓝无法处理自然语言,也无法识别非结构化的数据源。
和深蓝相比,沃森代表了认知计算时代一个崭新的计算模型,它可以阅读并理解自然语言,提出假设,并可寻求证据支持或反对假设,还可以不断地学习和进化。如果说深蓝留在了电脑的舒适区域,那么沃森则走进了一个看似让机器尴尬的领域,因为它尝试像人一样工作,甚至在某些方面比人做得更好。
2011年,正值IBM创立100周年之际,沃森参加了哥伦比亚广播公司的《危险边缘》(Jeopady!)节目,这档智力问答节目的问题包罗万象,节目的规则是答对问题得分,答错倒扣分。为了参加比赛,沃森不仅需要听懂人的自然语言,还需要分析语言背后的语义,在内置数据库中进行搜索,找到可能的多种答案,再对可能的答案一一进行评分。
评分过后,沃森需要选择3个有可能的答案,当其中一个答案评估的可能性超过50%的时候,沃森便会按下抢答键进行抢答,最终在人机对抗的比赛中,聪明的沃森打败了该节目最高奖金得主布拉德·鲁特尔(Brad Rutter)和连胜纪录保持者肯·詹宁斯(Ken Jennings),取得了冠军。
崭露头角之后,这位全美“最聪明的人”开始转战医疗健康领域,它花了两年的时间“修读”医学院课程,像人类那样做必要的知识储备。然而在起步阶段,沃森也历经了不少枯燥以及低技术含量的工作过程。安德森癌症中心以及IBM的研发团队花了好几个月,向沃森输入大量的病患信息,此类信息包括他们的姓名、年龄、性别、药物史、医学检测报告以及病患的就医笔记等。
一开始,沃森在语言识别上遇到了对人类来说很基本,对机器来说却很难的问题,譬如,当需要解读医生输入的“冷”(cold)的信息时,沃森无法识别“冷”在语境中,指代的到底是温度低还是一种流感病毒。又或者,它无法解读“T2”指代的是磁共振成像,还是癌症发展的一个阶段。所以,每一项信息的输入,都需要相关人员向沃森进行核实,需要他们手动输入被认为是“正确”的诊断。
此外,为了扩充沃森的知识量,帮助其更好地为病患进行诊断,科学家们让沃森“阅读”了大量的相关领域的顶尖文献,并帮助沃森学会如何在海量的信息中筛选出有用的信息,进行总结,提出可能性的报告。不同于人类做决策时容易受到外在环境和情绪的影响,沃森“冷静”、“理智”地在海量的数据源中,为医生快速寻找适合病人的诊疗方式,给出最佳的推荐。
截至2015年,IBM已经和北美14个癌症中心建立合作伙伴关系,成为诊断癌症的一个新型辅助途径。
沃森背后的技术革新IBM的深度开放域问答系统工程(Deep QA)是沃森背后的技术支持。深度开放域问答系统工程的发展,解决了临床决策支持系统多年以来突破不了的瓶颈。近40年来,临床决策支持系统致力于改善临床医生知识的局限性,减少人为疏忽,从而帮助病人找到最优的诊疗决策。
它一般包括诊断辅助工具(Diagnostic Support Tools)和治疗辅助工具(Treatment Support Tools)。第一代的临床决策支持系统(Clinical Decision Support System)主要致力于诊断辅助,然而解决方案的信息量太多,往往需要医生花费很多的时间阅读,所以在临床上并不具备实用性。
第二代临床决策支持系统致力于提高使用效率,它可以通过概括医生的笔记和医疗研究文献来为医生提供诊断建议,然而它仍无法在信息量很小的时候给出好的诊断,提取速度也非常慢。
这两代临床决策支持系统存在的问题,在沃森刚刚步入“职场”之际,哪怕是强大如谷歌的搜索引擎,也很难解决。这是因为,当时的谷歌不能从非结构化的信息中抓取问题。医生需要把查询的问题总结成关键字组合,输入谷歌来寻求答案。
其次,当谷歌按照结果的相关度查找到大量文献的时候,医生需要对此进行一一阅读,并且将重点加以概括从而得出结论,所以当时谷歌遭遇了与前两代临床决策支持系统一样的问题。事实上,IBM的深度开放域问答系统工程是在类似谷歌的搜索引擎之上,加上自然语言阅读能力和语义解析能力。谷歌依赖人类,IBM的深度开放域问答系统工程使得沃森可以靠自己解决问题。
它可以支持沃森阅读电子病历、化验结果、医学影像、视频以及病患传感器(如可穿戴医疗设备),从而生成假设,收集大量证据,最后进行分析和评估。
图1.沃森解决问题的流程图:1.沃森总结自然语言,生成一个搜索问题;2.沃森嵌入式搜索引擎搜索一个大型文档的知识库找到相关文件;3.沃森将搜索结果总结成自然语言,并且生成可能的解答(假设):a)对于每个假设,沃森构建并启动其他搜索以收集证据支持这一假设;b)沃森的嵌入式搜索引擎为每一个假设搜索论据;c)沃森总结搜索结果,并对每一个结果进行评分;d)给予每一个假设的支持论据,沃森给出一个评分。
4.所有的假设被转化成一张答案列表,返还给用户。在以上提及的4个步骤中,沃森对自然语言的处理体现在步骤1,3和3c,沃森的搜索能力体现在2,3a和3b,它的评分能力体现在3d和4。
作者:袁钧涛(Michael J. Yuan),系Ringful Health首席科学家。上图总结了沃森解决问题的流程。无论是对自然语言进行总结,还是对收集到的证据进行评分,沃森都需要对非结构化的语言文本进行处理。
它的内置的基于非结构化信息的管理架构(Apache UIMA)负责执行和解决用户提出的任务。对于接受的每一个任务,沃森都会开启多个搜索引擎,并且使用多样的搜索技术,从内置知识库中找出假设和佐证。沃森使用的搜索技术包括词频排名结果(Apache Lucene),贝叶斯网络排名结果(Indri),以及术语和文档之间的搜索关系(SPARQL)。
据Ringful Health首席科学家袁钧涛博士介绍,近年来,沃森在已有的深度开放域问答系统工程之上,又加入了很多“传统”的机器学习和数据处理技术。应用在癌症诊疗领域,它不单单可以对医生输入的问题提出多种诊疗建议,还可以向医生解释各类诊疗决策的异同,以便医生作出最后的判断。除了沃森,人工智能近年内正在极大地推进医疗领域的发展及变革,各大科技巨头正陆续向医疗健康领域进军。
如微软近日发现,分析搜索引擎可用来推测用户是否有患胰腺癌的前兆;微软还尝试让人工智能和机器学习用于分析患者的医学扫描图像,例如用于扫描并计算出脑肿瘤的大小,分析肿瘤组织成分,然后给出最佳治疗方案;谷歌发布了世界上准确度最高的自然语言解析器SyntaxNet;谷歌DeepMind正计划将人工智能算法更多地应用于医疗健康领域,包括在未来五年将机器学习技术用于处理英国国家医疗服务系统(NHS)的数据等。
人工智能给医疗健康带来深刻影响。沃森在医疗领域的迅猛发展,带来了多重的思考。一方面,它正在以惊人的速度成为完美的医学诊断专家,似乎具有在未来替代实体医生的可能性;另一方面,对于它是否有可能取代实体医生,直接给病患带去一对一的精准治疗的质疑声也不断传出。作为医生,如何看待和接受沃森,作为病患,又是否可以接受一个机器人的坐诊?部分观点认为,沃森的出现,将很有可能颠覆医患关系的主体。
因为机器人具有比人脑更多的数据容量,以及更为理性的判断,它将可能给病患带来更精准的治疗。比外,医疗机器人的普及,将有可能弱化不同地区医疗水平的不均给病患带来的差异,医疗欠发达地区的病患将得到更多的诊疗机会。
然而,与之相反的观点却认为,将沃森定位为医生的诊断辅助工具更为合适,因为虽然它在某些方面显示出优于医生的能力,但尚不足以完全取代医生。
维克森林大学医学院的助理教授胡塞恩医生(Iltifat Husain)表示,虽然沃森很大程度上帮助病人提升他们的医疗质量,但机器缺少人的本能和同理心。它无法察言观色,无法在人的言谈举止中捕捉对诊断可能起关键作用的隐藏信息。而这些隐藏信息,恰恰可能是确诊的关键。目前,沃森已经将诊断领域拓展到对糖尿病、肺癌的辅助诊断。
无论沃森是否会取代实体医生,在可预见的未来,可以肯定的是,以它为代表的认知计算系统,结合大数据和机器学习技术,将带动医疗健康领域医疗模式的发展与转型,为患者及医生带去更多疾病诊疗的福音。