堪比内科医生,科学家开发医疗AI模型管理患者。大型语言模型(LLM)在临床应用方面展现出令人鼓舞的发展,但它们往往专攻定义狭窄的任务。患者的临床管理需要多维度的方法,包括深入了解病史、进行适当的检查、做出准确的诊断、规划治疗方案(包括药物和手术)以及在多次就诊中监测治疗结果。如果AI智能体能够执行此类任务并实现有效的管理推理,它们或许能够协助医生处理常规工作,甚至可能缓解全球某些地区的医生短缺问题。
在6月17日发表于《自然》的两篇论文中,来自德国和美国的科学家分别报道了自主医疗AI智能体能力方面的进展。它们能够为患者管理从诊断到治疗决策的多个阶段提供协助,其表现堪比内科医生,证明了对话式AI工具在疾病管理方面的协助潜力。
在其中一项研究中,德国海德堡大学医院的Jakob Kather和同事介绍了MIRA——一个能够访问独立电子病历系统中患者数据的AI模型。该模型通过500多例急诊科临床病例的真实世界数据进行了评估。MIRA通过与患者AI智能体进行对话来收集信息,该代理的回应与临床记录中记载的病史相匹配。MIRA可从85,000多种选项中进行选择,以安排诊断检测、解读结果并制定治疗方案,包括开具处方、安排手术及办理入院手续。其平均诊断准确率达到87.8%,而由六位跨专科医生组成的专家组准确率仅为78.1%。研究者表示,未来需要进一步开展研究以提高准确率,并在真实世界研究中验证其泛化能力。
美国加州山景城谷歌研究公司的Mike Schaekermann和同事则介绍了AMIE——一个针对临床管理和对话进行优化的基于LLM的系统。该模型能够对多次就诊数据进行连续推理,从而追踪疾病进展和治疗反应。AMIE利用Gemini分析从患者处获取的信息,并使其输出结果与相关且最新的临床实践指南及药物目录(经批准且临床首选药物的清单)保持一致。在一项虚拟临床检查研究中,AMIE与21名全科医生在100个多就诊案例场景及五个医学专科领域进行了对比,这些场景旨在反映英国国家卫生与临床优化研究所的指导意见及《英国医学杂志》最佳实践指南。在管理推理能力方面,AMIE的表现与真实医生相当;而在治疗和检查的精准度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面,AMIE的表现均优于医生。在最新推出的药物推理基准上,AMIE在处理疑难病例时的表现优于医生。研究者指出,AMIE在投入临床护理前仍需进一步完善,但认为这项研究标志着利用对话式人工智能工具辅助医生进行疾病管理迈出了重要一步。
相关论文信息:
https://doi.org/10.1038/s41586-026-10675-5
https://doi.org/10.1038/s41586-026-10764-5
作者:冯维维 来源:中国科学报