2025 年 1 月 14 日 下午 3:13

VentureBeat/Ideogram
订阅我们的每日和每周通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
生成式 AI 已成为许多行业的关键基础设施,医疗保健也不例外。然而,随着葛兰素史克 (GSK) 等组织不断突破生成式 AI 的能力边界,他们面临着重大挑战,尤其是在可靠性方面。幻觉,即 AI 模型生成不正确或虚构的信息,是药物发现和医疗保健等高风险应用中持续存在的问题。对于葛兰素史克来说,解决这些挑战需要利用测试时计算扩展来改进生成式 AI 系统。以下是他们的做法。
医疗保健应用需要极高的准确性和可靠性。错误不仅是不方便的,而且可能产生改变人生的后果。这使得大型语言模型 (LLM) 中的幻觉成为葛兰素史克等公司的关键问题,这些公司将生成式 AI 应用于科学文献回顾、基因组分析和药物发现等任务。
为了减轻幻觉,葛兰素史克采用了先进的推理时计算策略,包括自我反思机制、多模型采样和迭代输出评估。葛兰素史克 AI 和机器学习 (ML) 副总裁 Kim Branson 表示,这些技术有助于确保代理“稳健可靠”,同时使科学家能够更快地生成可操作的见解。
测试时计算扩展是指在 AI 系统的推理阶段增加计算资源的能力。这允许进行更复杂的运算,例如迭代输出细化或多模型聚合,这些对于减少幻觉和提高模型性能至关重要。
Branson 强调了扩展在葛兰素史克 AI 工作中的变革作用,他指出:“我们致力于在葛兰素史克加快迭代周期——如何更快地思考。” 通过使用自我反思和集成建模等策略,葛兰素史克可以利用这些额外的计算周期来生成既准确又可靠的结果。
Branson 还谈到了更广泛的行业趋势,他说:“你正在看到这场关于我能提供多少服务、每个令牌的成本和每个令牌的时间的战争。这使得人们能够采用以前在技术上不可行的不同算法策略,这也将推动代理的部署和采用。”
葛兰素史克已将幻觉确定为生成式 AI 在医疗保健中的关键挑战。该公司采用了两种主要策略,这些策略需要在推理过程中使用额外的计算资源。应用更彻底的处理步骤可确保在临床或研究环境中提供答案之前检查每个答案的准确性和一致性,在这些环境中,可靠性至关重要。
一项核心技术是自我反思,其中 LLM 批评或编辑自己的响应以提高质量。该模型“逐步思考”,分析其初始输出,找出弱点并根据需要修改答案。葛兰素史克的文献搜索工具就是这方面的典范:它从内部存储库和 LLM 的内存中收集数据,然后通过自我批评重新评估其发现,以发现不一致之处。
这个迭代过程产生了更清晰、更详细的最终答案。Branson 强调了自我批评的价值,他说:“如果你只能做一件事,那就做这件事。” 在提供结果之前完善自己的逻辑,使系统能够产生符合医疗保健严格标准的见解。
葛兰素史克的第二种策略依赖于多个 LLM 或单个模型的不同配置来交叉验证输出。在实践中,系统可能会在不同的温度设置下运行相同的查询以生成不同的答案,使用针对特定领域进行微调的相同模型版本,或调用在不同数据集上训练的完全独立的模型。
比较和对比这些输出有助于确认最一致或最一致的结论。Branson 说:“你可以获得通过不同的正交方式得出相同结论的效果。” 尽管这种方法需要更多的计算能力,但它减少了幻觉并增强了对最终答案的信心——这在高风险的医疗保健环境中至关重要。
葛兰素史克的策略依赖于能够处理明显更重计算负载的基础设施。Branson 将其称为“推理战争”,AI 基础设施公司(如 Cerebras、Groq 和 SambaNova)竞相提供硬件突破,以提高令牌吞吐量、降低延迟并降低每个令牌的成本。
专用芯片和架构能够大规模地进行复杂的推理例程,包括多模型采样和迭代自我反思。例如,Cerebras 的技术每秒处理数千个令牌,使先进的技术能够在现实世界场景中发挥作用。Branson 指出:“你正在看到这些创新的成果直接影响着我们如何在医疗保健中有效地部署生成式模型。”
当硬件跟上软件需求时,就会出现解决方案来保持准确性和效率。
挑战依然存在
即使有了这些进步,扩展计算资源也存在障碍。更长的推理时间可能会减慢工作流程,尤其是在临床医生或研究人员需要快速结果的情况下。更高的计算使用量也会增加成本,需要仔细管理资源。尽管如此,葛兰素史克认为这些权衡对于提高可靠性和更丰富的功能是必要的。
Branson 指出:“当我们在代理生态系统中启用更多工具时,系统对人们变得更有用,最终会导致计算使用量增加。” 在性能、成本和系统功能之间取得平衡,使葛兰素史克能够保持一种实用但面向未来的策略。
葛兰素史克计划继续完善其 AI 驱动的医疗保健解决方案,并将测试时计算扩展作为首要任务。自我反思、多模型采样和强大基础设施的结合有助于确保生成式模型满足临床环境的严格要求。
这种方法也为其他组织提供了一条路线图,说明如何协调准确性、效率和可扩展性。在计算创新和复杂推理技术方面保持领先地位,不仅可以解决当前的挑战,而且可以为药物发现、患者护理等领域的突破奠定基础。