2月11日,一项“AI+医疗”成果登上顶级医学科研期刊《Nature Medicine》,该成果基于机器学习的自然语言处理(NLP)技术,实现评估和准确诊断儿科疾病。广州市妇女儿童医疗中心、依图医疗、美国加州大学圣迭戈分校等团队和机构参与了此次研究。

据介绍,这是全球首次在顶级医学杂志发表有关自然语言处理(NLP)技术基于电子健康记录(EHR)做临床智能诊断的研究成果。论文标题名为“Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence”(《使用人工智能评估和准确诊断儿科疾病》)。

AI可准确诊断常见儿童疾病 ,中国团队成果登上Nature子刊-肽度TIMEDOO

一直以来,尽管机器学习在影像诊断方面表现强势,但在数量巨大、多样的电子病历数据分析方面,仍面临巨大挑战。电子病历的数据信息之广、数据类型之多,以及某些方面的数据贫乏及可能出现的特殊案例等,都导致机器学习难以进行精确的数据分析,并进而形成预测临床检测的数据模型。

AI可准确诊断常见儿童疾病 ,中国团队成果登上Nature子刊-肽度TIMEDOO

图丨人工智能系统诊断儿科疾病流程图(来源:本篇论文)

据依图介绍,这一次,团队提出并测试了一个专门对电子医学病例进行数据挖掘的系统框架,将医学知识和数据驱动模型结合在一起。该模型先通过NLP对电子病例进行标注,利用逻辑回归来建立层次诊断,在常见儿童疾病方面的综合诊断准确率优于相对低年资儿科医生(3年+8年临床经验)。

相比以往模型,此次研究使用了超过140万的庞大数据,以完善诊断系统,使用数据在表达和描述上的一致性,极大的提高了数据质量。此次研究还基于NLP实现了病历的重新格式化:有超过25年临床实践经验的资深主治医师手动注释了6,183个图表,然后用3,564张人工标注的图表对NLP信息提取模型进行训练,并用剩下的2,619张图表对模型进行验证。该NLP模型总结了代表临床数据的关键概念类别,利用深度学习技术自动将EHR注释到标准化词汇和临床特征中,从而允许对诊断分类进行进一步处理。

从数据来看,以呼吸系统疾病为例,模型对上呼吸道疾病和下呼吸道疾病的诊断准确率分别为89%和87%,而在上呼吸道疾病诊断中,急性喉炎和鼻窦炎的准确率分别高达86%和96%,对不同类型哮喘的诊断准确率从83%到97%。同时对普通系统性疾病以及危险程度更高的疾病也有很高的诊断准确率,例如传染性单核细胞增多症(90%)、水痘(93%)、玫瑰疹(93%)、流感(94%)、手足口病(97%)和细菌性脑膜炎(93%)。也就是说,该系统可以根据NLP系统注释的临床数据信息对儿科疾病做出准确的判断。

AI可准确诊断常见儿童疾病 ,中国团队成果登上Nature子刊-肽度TIMEDOO

图丨人工智能系统和医疗团队在儿科疾病诊断水平的比较(来源:本篇论文)

此次研究的一大亮点,还在于其具备极强的多场景应用能力。例如在分诊环节,通过记录基础数据让模型产生预测诊疗结果,并通过这个结果评估病人的优先级,以确保医生可以按需就诊。基于AI的诊断模型还可以帮助医生诊断复杂或罕见病症,提示可能情况,避免由于医生受限于自身专业或经验,在复杂病症出现时出现误诊。

此外,基于 EHR 构建的高质量智能病种库,还可打破原有信息化系统的界限,便于更多的科研项目和业务领域高效地使用,优化临床数据的获取链路,以及打造更具价值的诊断系统,提升临床诊疗的效率。

毫无疑问的是,在大数据时代,医疗信息正变得越来越复杂。近年来,疾病实体、诊断测试和生物标志物以及治疗方式的范围呈指数级增长,临床决策也变得更加复杂,需要大量数据点的综合。在当前的数字时代,EHR代表了大量的电子数据点存储库,这些数据点代表了各种各样的临床信息。人工智能方法已经成为挖掘EHR数据的潜在强大工具,以帮助疾病诊断和管理,模仿甚至可能增强人类医生的临床决策。

作为Nature杂志专注于生物医学领域的专业子刊,Nature Medicine注重基础研究和涵盖医学各方面的早期临床研究,高度关注人工智能技术对医疗行业带来的巨大革新作用。在2019年1月刊中,Nature Medicine曾发表9篇论文聚焦AI医疗,相信未来还会有更多人工智能在医疗行业深度落地的案例出现。

来源:麻省理工科技评论