AI 赋能精准医疗:Cerebras 与梅奥诊所合作开发基因组模型
在人工智能浪潮席卷全球的今天,医疗领域也迎来了前所未有的变革。Cerebras Systems 与梅奥诊所携手,共同开发了一款基于人工智能的基因组模型,旨在为类风湿性关节炎患者提供更精准的治疗方案。
Cerebras Systems 首席执行官 Andrew Feldman 在接受 GamesBeat 采访时表示,该模型也可能用于预测癌症和心血管疾病患者的最佳治疗方案。
在最近于旧金山举行的摩根大通医疗保健大会上,梅奥诊所宣布了与 Cerebras Systems 合作开发人工智能工具的重大进展。作为致力于医疗保健转型的机构,梅奥诊所一直致力于开发世界一流的基因组模型,旨在为医生和患者提供支持。
与英伟达和其他半导体公司一样,Cerebras 专注于人工智能超级计算。但其方法与英伟达大不相同,英伟达依赖于独立的人工智能处理器。Cerebras Systems 设计了整个晶圆——在一个硅晶圆上包含多个芯片——这些芯片共同解决大型人工智能问题和其他计算任务,同时功耗更低。Feldman 表示,计算基因组模型需要数十个这样的系统,耗时数月。然而,这仍然比传统的计算解决方案节省了大量时间、精力、电力和成本。PitchBook 最近预测 Cerebras 将在 2025 年进行 IPO。
Cerebras Systems 的计算可以确定哪种治疗方法对患有类风湿性关节炎的特定患者有效。
该模型建立在梅奥诊所在精准医疗领域的领先地位之上,旨在改进诊断并个性化治疗选择,最初重点关注类风湿性关节炎 (RA)。RA 治疗是一个重大的临床挑战,通常需要多次尝试才能找到对个体患者有效的药物。
传统方法检查单个遗传标记在预测治疗反应方面取得的成功有限。
该联合团队的基因组模型通过将公开的人类参考基因组数据与梅奥的全面患者外显子组数据混合进行训练。人类参考基因组是一个数字 DNA 序列,代表人类基因组的综合“理想化”版本。它作为一种标准框架,可以与个体人类基因组进行比较,使研究人员能够识别遗传变异。
与仅在人类参考基因组上训练的模型相比,梅奥的基因组基础模型在基因组变异分类方面表现出明显更好的结果,因为它是在来自 500 名梅奥诊所患者的数据上进行训练的。随着更多患者数据被纳入训练,该团队预计模型质量将持续提高。
该团队设计了新的基准来评估模型的临床相关能力,例如从 DNA 数据中检测特定医疗状况,填补了公开基准的空白,这些基准主要集中在识别结构元素(如调控或功能区域)。
Cerebras Systems 表示,其人工智能治疗预测非常准确。
梅奥诊所基因组基础模型在几个关键领域展现出最先进的准确性:RA 基准的准确率为 68-100%,癌症易感性预测的准确率为 96%,心血管表型预测的准确率为 83%。这些能力符合梅奥诊所通过人工智能技术提供世界领先医疗保健的愿景。Feldman 表示,需要进行更多测试来验证结果。
“梅奥诊所致力于使用最先进的人工智能技术来训练模型,这些模型将从根本上改变医疗保健,”梅奥诊所战略医疗主管兼放射学主席 Matthew Callstrom 在一份声明中表示。“我们与 Cerebras 的合作使我们能够为基因组学创建最先进的人工智能模型。在不到一年的时间里,我们开发了有前景的人工智能工具,这些工具将帮助我们的医生根据基因组数据做出更明智的决策。”
“梅奥的基因组基础模型为基因组模型设定了新的标准,不仅在预测 DNA 的功能和调控特性等标准任务方面表现出色,而且还能够发现遗传变异与医疗状况之间复杂关联的发现,”Cerebras Systems 的现场首席技术官 Natalia Vassilieva 在一份声明中表示。“与当前专注于单一变异关联的方法不同,该模型能够发现变异集合导致特定疾病的关联。”
Cerebras Systems 可以解析突变的含义。
这些模型的快速开发(通常需要数年时间)通过在 Cerebras AI 平台上训练梅奥诊所的定制模型而加速。梅奥基因组基础模型代表着朝着增强临床决策支持和推进精准医疗迈出的重要一步。
Cerebras 的旗舰产品是 CS-3,该系统由 Wafer-Scale Engine-3 提供支持。
此外,梅奥诊所今天还公布了与微软研究院和 Cerebras Systems 在生成式人工智能 (AI) 领域的独立突破性合作,旨在个性化患者护理,显著加快诊断时间并提高准确性。
在摩根大通医疗保健大会上宣布的这些项目专注于开发和测试针对各种应用定制的基础模型,利用微软研究院的多模态放射影像和数据(包括 CT 扫描和 MRI)以及 Cerebras 的基因组测序数据的力量。
这些创新有可能改变临床医生进行诊断和治疗的方式,最终导致更好的患者预后。基础人工智能模型是大型预训练模型,能够适应并执行许多任务,而无需额外的训练。它们从海量数据集中学习,获得可以跨各种应用使用的通用知识。这种适应性使它们成为众多人工智能系统的有效且通用的构建块。
梅奥诊所和微软研究院正在合作开发整合文本和图像的基础模型。对于此用例,梅奥和微软研究院正在共同探索在放射学中使用生成式人工智能,使用微软研究院的人工智能技术和梅奥诊所的 X 光数据。
为临床医生提供即时访问所需信息的权限是该研究项目的核心。梅奥诊所的目标是开发一个模型,该模型可以自动生成报告、评估胸部 X 光片中的管线放置情况,以及检测与先前图像的差异。这个概念验证模型旨在通过提供对放射影像的更有效和更全面的分析来改善临床工作流程和患者护理。
梅奥诊所拥有 76,000 名员工,每年接待大量患者。
“我们开始合作,将人工智能技术引入医疗保健。这使我们能够将他们的领域专业知识、他们非凡的数据与我们的人工智能专业知识和计算能力相结合,”Feldman 说。
他表示,大型语言模型预测单词,而基因组模型预测核苷酸。当核苷酸在突变或转录错误中发生翻转时,它可能是疾病的原因,或者可以预测疾病的发生。
现有的模型只能询问单个核苷酸的翻转是否预测疾病。但 Cerebras 观察了多个核苷酸的翻转,并得出了更准确的模型。
“我们与梅奥诊所一起使用它来预测哪种药物对特定患者有效,”Feldman 说。
这是一个十亿参数的基础模型,是 AlphaFold 的十倍大,并且在万亿个标记上进行训练。Feldman 说,这使得它更加准确。
患者经常不得不经历反复试验才能找到有效的药物。但 Feldman 相信,有了这个模型,它可以预测哪种药物对特定的人有效。第一个目标是类风湿性关节炎,这种疾病影响着 130 万美国人。
“虽然还处于早期阶段,但我们已经能够证明,我们能够以令人印象深刻的准确性预测哪种药物对特定患者有效,”他说。
在关节炎方面,预测准确率为 87%。数据仍需发表并经过同行评审。