订阅我们的每日和每周通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
患者数据记录可能错综复杂,有时甚至不完整,这意味着医生并不总是能够随时获得他们需要的所有信息。除此之外,医疗专业人员也不可能跟上行业中涌现的大量案例研究、研究论文、试验和其他尖端发展。
总部位于纽约市的纽约大学朗格尼健康中心为下一代医生找到了解决这些挑战的新方法。
这个学术医疗中心——包括纽约大学格罗斯曼医学院和纽约大学格罗斯曼长岛医学院,以及六家住院医院和 375 个门诊部——开发了一个大型语言模型 (LLM),它充当受人尊敬的研究伙伴和医疗顾问。
每天晚上,该模型都会处理电子健康记录 (EHR),并将它们与相关研究、诊断提示和基本背景信息进行匹配,然后在第二天早上以简洁、个性化的电子邮件发送给住院医师。这是纽约大学朗格尼开创性医疗教育方法——它称之为“精准医疗教育”——使用人工智能和数据提供高度定制的学生学习旅程的一个基本部分。
“这种‘一切精准’的概念在医疗保健中是必要的,”纽约大学朗格尼健康中心教育信息学副院长兼医疗教育创新研究所主任马克·特里奥拉告诉 VentureBeat。“显然,越来越多的证据表明,人工智能可以克服医疗保健系统中的许多认知偏差、错误、浪费和低效率,它可以改善诊断决策。”
纽约大学朗格尼正在使用一个基于最新版本的 Llama-3.1-8B-instruct 和开源 Chroma 向量数据库的开放权重模型,用于检索增强生成 (RAG)。但这不仅仅是访问文档——该模型超越了 RAG,积极地利用搜索和其他工具来发现最新的研究文档。
每天晚上,该模型都会连接到该机构的 EHR 数据库,并提取前一天在朗格尼就诊的患者的医疗数据。然后,它会搜索有关诊断和医疗状况的基本背景信息。特里奥拉解释说,该模型还使用 Python API 对 PubMed 中的相关医学文献进行搜索,PubMed 中有“数百万篇论文”。LLM 会筛选评论、深入研究论文和临床试验,选择几个看似最相关的论文,并将“所有内容整合到一封漂亮的电子邮件中”。
第二天早上,医学生以及内科、神经外科和放射肿瘤科住院医师会收到一封包含详细患者摘要的个性化电子邮件。例如,如果一名患有充血性心力衰竭的患者前一天来进行体检,电子邮件将提供有关心脏病基本病理生理学和最新治疗方法的信息。它还提供自学问题和人工智能精选的医学文献。此外,它可能会提供有关住院医师下一步可以采取的步骤或他们可能忽略的操作或细节的提示。
“我们从学生、住院医师和教职工那里获得了很好的反馈,他们表示这让他们能够无缝地了解最新信息,他们正在将这些信息融入他们对患者护理计划做出选择的过程中,”特里奥拉说。
对他个人来说,一个关键的成功指标是当系统中断导致电子邮件暂停几天时——教职工和学生抱怨他们没有收到他们已经依赖的早晨提醒。
“因为我们是在医生开始查房之前发送这些电子邮件的——这对于他们来说是最疯狂、最繁忙的时间之一——他们注意到没有收到这些电子邮件,并且在思考过程中错过了这些电子邮件,这真是太棒了,”他说。
这个复杂的 AI 检索系统是纽约大学朗格尼精准医疗教育模型的基础,特里奥拉解释说,该模型基于“更高密度、无摩擦”的数字数据、人工智能和强大的算法。
在过去十年中,该机构收集了大量有关学生的数据——他们的表现、他们在照顾患者的环境、他们编写的 EHR 笔记、他们做出的临床决策以及他们通过患者互动和护理进行推理的方式。此外,纽约大学朗格尼拥有一个庞大的目录,其中包含所有可供医学生使用的资源,无论是视频、自学或考试问题,还是在线学习模块。
该项目的成功也归功于该医疗机构的简化架构:它拥有集中式 IT、医疗保健方面的单一数据仓库和教育方面的单一数据仓库,使朗格尼能够将各种数据资源结合起来。
首席医疗信息官保罗·泰斯塔指出,如果没有大量数据,就无法实现伟大的 AI/ML 系统,但“如果你坐在系统中各个孤岛中未存储的数据上,这并非易事。”该医疗系统可能很大,但它以“一个患者、一个记录、一个标准”的方式运作。
正如特里奥拉所说,他的团队一直在努力解决的主要问题是:“他们如何将诊断、个别学生的背景以及所有这些学习材料联系起来?”
“突然之间,我们有了这把打开这把锁的钥匙:生成式人工智能,”他说。
这使得该学校能够摆脱“一刀切”的模式,这种模式一直是常态,无论学生是想成为神经外科医生还是精神科医生——这些是需要独特方法的截然不同的学科。
他说,重要的是,学生在整个学习过程中都能获得量身定制的教育,以及适应他们需求的“教育提醒”。但你不能只是告诉教职工“花更多时间与每个学生在一起”——这在人力上是不可能的。
“我们的学生一直渴望得到这种教育,因为他们认识到,这是医学和生成式人工智能快速变化的时期,”特里奥拉说。“它绝对会改变……成为一名医生的意义。”
当然,在此过程中也遇到了一些挑战。值得注意的是,技术团队一直在努力解决模型的“不成熟”。
正如特里奥拉所说:“他们嵌入的知识的广度和准确性令人着迷,有时也很有限。它会连续 99 次完美、可预测地工作,然后在第 100 次时,它会做出一些有趣的选择。”
例如,在开发初期,LLM 无法区分皮肤上的溃疡和胃部的溃疡,而这两种溃疡“在概念上完全没有关系,”特里奥拉解释说。他的团队此后一直专注于提示细化和基础,结果“非凡”。
事实上,他的团队对该堆栈和流程如此自信,以至于他们认为它可以成为其他人的一个很好的榜样。“我们更喜欢开源和开放权重,因为我们想达到一个点,我们可以说,‘嘿,其他医学院,其中许多没有太多资源,你们可以廉价地做到这一点,”特里奥拉解释说。
泰斯塔表示同意:“它可以复制吗?我们想传播它吗?当然,我们想在整个医疗保健领域传播它。”
可以理解的是,整个行业对可能嵌入在 AI 系统中的细微偏差感到担忧。然而,特里奥拉指出,在这种情况中,这并不是一个很大的问题,因为它对于 AI 来说是一个相对简单的任务。“它在搜索,它在从列表中选择,它在总结,”他指出。
相反,其中一个最大的表面问题是围绕着技能下降或技能下降。这里有一个相关性:那些有一定年龄的人可能还记得在小学学习书法——但他们可能已经忘记了这种技能,因为他们在成年生活中很少有机会使用它。现在,它几乎过时了,在当今的小学教育中很少教授。
特里奥拉指出,成为一名医生的某些部分是“神圣不可侵犯的”,有些人坚决反对以任何方式、任何形式将这些部分交给人工智能或数字系统。例如,有一种观念认为,年轻医生应该在不在临床环境中的时候积极地进行研究,并深入研究最新的文献。但特里奥拉强调,当今可获得的医学知识量以及临床医学的“狂热节奏”要求采用不同的做事方式。
在研究和检索信息方面,他指出:“人工智能做得更好,这是一个许多人都不愿相信的令人不舒服的真相。”
相反,他假设:“假设这将赋予医生超能力,并找出人与人工智能之间的协同关系,而不是谁将做什么的竞争关系。”