科学家如何用 Claude 加速科研与发现
技术· 8 分钟阅读1 阅读
Anthropic 推出 Claude for Life Sciences 后,科学家们正利用 Claude 大语言模型重塑研究流程。从斯坦福大学的 Biomni 通用生物医学智能体,到 MIT 的 MozzareLLM 自动化基因簇解读,再到 Lundberg 实验室的 AI 驱动假设生成,这些案例显示 AI 正从辅助工具演变为能压缩数月工作至数小时、发现人类可能忽略模式的科研伙伴。
去年十月,Anthropic 推出了 Claude for Life Sciences——一套连接器和技能,让 Claude 成为更出色的科学合作者。此后,公司投入大量资源使 Claude 成为科学工作能力最强的模型,Opus 4.5 在图表解读、计算生物学和蛋白质理解基准测试中显示出显著提升。这些进步源于与学术界和工业界研究人员的合作,反映了 Anthropic 致力于准确理解科学家如何利用 AI 加速进展。
公司还通过AI for Science 项目与科学家密切合作,为全球从事高影响力科学项目的领先研究人员提供免费 API 额度。
这些研究人员开发了定制系统,以远超文献综述或编码辅助的方式使用 Claude。在受访的实验室中,Claude 是跨越研究过程所有阶段的合作者:更容易且更具成本效益地理解应运行哪些实验,使用多种工具将通常耗时数月的项目压缩至数小时,并在海量数据集中发现人类可能忽略的模式。在许多情况下,它消除了瓶颈,处理需要深厚知识且以前无法扩展的任务;在某些情况下,它使研究人员能够采用与传统方法完全不同的研究途径。
换句话说,Claude 正开始重塑这些科学家的工作方式,并引导他们走向新颖的科学见解和发现。
Biomni:一个能访问数百种工具和数据库的通用生物医学智能体
生物学研究的一个瓶颈是工具碎片化:有数百个数据库、软件包和协议可用,研究人员花费大量时间从各种平台中选择和掌握。在理想情况下,这些时间本应用于运行实验、解读数据或追求新项目。
Biomni 是斯坦福大学的一个智能体 AI 平台,将数百种工具、包和数据集收集到一个单一系统中,由 Claude 驱动的智能体可导航其中。研究人员用简单英语给出请求;Biomni 自动选择适当资源。它能在超过 25 个生物学子领域中形成假设、设计实验协议并执行分析。
以全基因组关联研究(GWAS)为例,这是一种寻找与某些性状或疾病相关的遗传变异的方法。例如,绝对音高有很强的遗传基础。研究人员会选取一大群人——一些能在没有任何参考音调的情况下产生音符,另一些你永远不会邀请去卡拉 OK——并扫描他们的基因组,寻找在一组中比另一组更频繁出现的遗传变异。
基因组扫描(相对)简单。耗时的是数据分析和理解过程:基因组数据以混乱格式出现,需要大量清理;研究人员必须控制混杂因素并处理缺失数据;一旦他们识别出任何“命中”,就需要弄清楚它们实际意味着什么——附近有什么基因(因为 GWAS 仅指向基因组中的位置),它在哪些细胞类型中表达,可能影响哪些生物通路等。每一步可能涉及不同的工具、不同的文件格式和大量手动决策。这是一个繁琐的过程。单个 GWAS 可能需要数月。但在 Biomni 的早期试验中,它只用了 20 分钟。
这听起来可能好得令人难以置信——我们能确定这种 AI 分析的准确性吗?Biomni 团队通过不同领域的几个案例研究验证了 该系统。在一个案例中,Biomni 设计了一个分子克隆实验;在盲评中,协议和设计与拥有超过五年经验的博士后相匹配。在另一个案例中,Biomni 仅用 35 分钟分析了来自 30 个不同人的超过 450 个可穿戴数据文件(混合了连续血糖监测、温度和身体活动)的数据——这项任务估计需要人类专家三周。在第三个案例中,Biomni 分析了来自人类胚胎组织的超过 336,000 个单个细胞的基因活性数据。系统确认了科学家已知的调控关系,但也识别出研究人员以前未与人类胚胎发育关联的新转录因子——控制基因开关的蛋白质。
Biomni 不是一个完美的系统,因此它包含护栏以检测 Claude 是否偏离轨道。它也不能开箱即用地做所有事情。然而,在它不足的地方,专家可以将他们的方法编码为技能——教导智能体专家如何解决问题,而不是让它即兴发挥。例如,在与未诊断疾病网络合作进行罕见病诊断时,团队发现 Claude 的默认方法与临床医生的做法大不相同。因此他们采访了一位专家,逐步记录他们的诊断过程,并教给 Claude。有了这些新的、以前隐含的知识,智能体表现良好。
Biomni 代表了一种方法:一个将数百种工具整合在一起的通用系统。但其他实验室正在构建更专门的系统——针对他们自己研究工作流程中的特定瓶颈。
Cheeseman 实验室:自动化大规模基因敲除实验的解读
当科学家想了解一个基因的作用时,一种方法是将其从相关细胞或生物体中移除,看看什么会出问题。大约 2012 年出现的基因编辑工具 CRISPR,使这能够精确地大规模进行。但 CRISPR 的效用仍然有限:实验室可以生成比他们分析能力多得多的数据。
这正是 MIT 怀特黑德研究所和生物系的 Iain Cheeseman 实验室 面临的挑战。他们使用 CRISPR 在数千万个人类细胞中敲除数千个不同基因,然后拍摄每个细胞以观察变化。这些图像中的模式显示,做类似工作的基因在被移除时往往产生相似外观的损伤。软件可以检测这些模式并自动将基因分组——Cheeseman 的实验室构建了一个名为 Brieflow 的流程来做这件事(是的,就是布里奶酪)。
但解读这些基因分组意味着什么——为什么基因聚集在一起,它们可能有什么共同点,是已知的生物关系还是新事物——仍然需要人类专家逐一梳理科学文献。这很慢。单个筛选可以产生数百个簇,大多数从未被调查,仅仅因为实验室没有时间、带宽或关于细胞所做多样事情的深入知识。
多年来,Cheeseman 自己完成所有解读。他估计他能凭记忆回忆起大约 5,000 个基因的功能,但仍然需要数百小时来有效分析这些数据。为了加速这一过程,博士生 Matteo Di Bernardo 试图构建一个自动化 Cheeseman 方法的系统。与 Cheeseman 密切合作,准确理解他如何进行解读——他咨询什么数据源,寻找什么模式,什么使发现有趣——他们构建了一个名为 MozzareLLM 的 Claude 驱动系统(你可能看到这里有一个主题在发展)。
它取一个基因簇,并做像 Cheeseman 这样的专家会做的事:识别它们可能共享的生物过程,标记哪些基因被充分理解与哪些研究不足,并突出哪些可能值得跟进。这不仅大大加速了他们的工作,还帮助他们做出重要的额外生物发现。Cheeseman 发现 Claude 始终能捕捉到他遗漏的东西。“每次我检查时,我都在想,我没注意到那个!在每种情况下,这些都是我们可以理解和验证的发现,”他说。
使 MozzareLLM 如此有用的原因是它不是一招鲜:它能整合多样信息并像科学家一样推理。最值得注意的是,它提供其发现的置信水平,Cheeseman 强调这至关重要。它帮助他决定是否投入更多资源跟进其结论。
在构建 MozzareLLM 时,Di Bernardo 测试了多个 AI 模型。Claude 优于其他模型——在一个案例中正确识别了一个 RNA 修饰通路,而其他模型将其视为随机噪声。
Cheeseman 和 Di Bernardo 设想将这些 Claude 注释的数据集公开——让其他领域的专家跟进他的实验室没有时间追求的簇。例如,线粒体生物学家可以深入研究 Cheeseman 团队标记但从未调查的线粒体簇。随着其他实验室采用 MozzareLLM 进行自己的 CRISPR 实验,它可以加速多年来功能未表征的基因的解读和验证。
Lundberg 实验室:测试 AI 驱动的假设生成以确定研究哪些基因
Cheeseman 实验室使用光学池筛选——一种让他们在单个实验中敲除数千个基因的技术。他们的瓶颈是解读。但并非所有细胞类型都适用于池化方法。一些实验室,如斯坦福的 Lundberg 实验室,运行较小、聚焦的筛选,他们的瓶颈更早出现:首先决定靶向哪些基因。
因为单个聚焦筛选可能花费超过 20,000 美元,且成本随规模增加,实验室通常靶向他们认为最可能参与特定条件的几百个基因。传统过程涉及一组研究生和博士后围坐在 Google 电子表格旁,逐一添加候选基因并附上一句理由,或可能是一篇论文的链接。这是一个有根据的猜测游戏,基于文献综述、专业知识和直觉,但受限于人类带宽。它也是易错的,基于其他科学家已经发现和记录的内容,以及在场人类碰巧回忆的内容。
Lundberg 实验室正在使用 Claude 翻转这种方法。他们的系统不是问“基于研究人员已经研究的内容,我们能做出什么猜测?”,而是问“基于分子特性,应该研究什么?”
团队构建了细胞中每个已知分子——蛋白质、RNA、DNA——以及它们如何相互关联的地图。他们绘制了哪些蛋白质结合,哪些基因编码哪些产物,以及哪些分子结构相似。然后他们可以给 Claude 一个目标——例如哪些基因可能控制特定细胞结构或过程——Claude 导航该地图以根据其生物特性和关系识别候选基因。
Lundberg 实验室目前正在运行一个实验来研究这种方法的效果如何。为此,他们需要确定一个研究很少的主题(如果他们查看研究充分的内容,Claude 可能已经知道已建立的发现)。他们选择了初级纤毛:细胞上的天线状附属物,我们对其知之甚少,但与多种发育和神经系统疾病有关。接下来,他们将运行全基因组筛选,看看哪些基因实际影响纤毛形成,并建立真实情况。
测试是比较人类专家与 Claude。人类将使用电子表格方法做出猜测。Claude 将使用分子关系地图生成自己的猜测。如果 Claude(假设)捕获 200 个中的 150 个,而人类捕获 200 个中的 80 个,那就证明这种方法效果更好。即使他们在发现基因方面大致相等,Claude 很可能工作得更快,可以使整个研究过程更高效。
如果这种方法有效,团队设想它成为聚焦扰动筛选的标准第一步。实验室可以基于信息做出靶向哪些基因的明智赌注——获得更好结果,而不需要全基因组筛选的基础设施,而不是依赖直觉或使用在当代研究中变得普遍的蛮力方法。
展望未来
这些系统都不完美。但它们指出了在短短几年内,科学家已开始将 AI 作为研究伙伴的方式,其能力远超基本任务——实际上,越来越能够加速,在某些情况下甚至取代研究过程的许多不同方面。
在与这些实验室交谈时,一个共同主题浮现:他们构建的工具的有用性与 AI 能力同步增长。每个模型发布都带来显著改进。就在两年前,早期模型仅限于编写代码或总结论文,而更强大的智能体已经开始,尽管缓慢地,复制那些论文描述的工作。
随着工具进步和 AI 模型继续变得更智能,我们继续观察并学习科学发现如何与它们一起发展。
想了解 AI 如何助力您的企业?
免费获取企业 AI 成熟度诊断报告,发现转型机会
//
24小时热榜
免费获取 AI 落地指南
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断

