In nature, fluorescent proteins are used by jellyfish as a defense mechanism. GABRIEL BOUYS/AFP via Getty Images
前Meta 研究员创办的 AI 初创公司 EvolutionaryScale 或将彻底改变生物学
EvolutionaryScale 是一家由前 Meta 研究人员创办的 AI 生物技术初创公司,该公司于 6 月 25 日正式亮相,并发布了一个大型语言模型 (LLM),据称该模型可以模拟长达 5 亿年的自然进化过程来设计蛋白质。该公司的首席科学家是计算机科学家 Alexander Rives。
EvolutionaryScale 脱胎于 Meta 的基础人工智能研究 (FAIR) 部门。该公司还宣布,已在种子轮融资中筹集了 1.42 亿美元,这对于种子轮融资来说是一个巨大的数字。这轮融资由前 GitHub 首席执行官 Nat Friedman 和企业家兼投资者 Daniel Gross 领投(Daniel Gross 也是 OpenAI 被解雇的首席科学家 Ilya Sutskever 新创办的初创公司 Superintelligence 的联合创始人)。风险投资公司 Lux Capital 也参与了这轮融资,亚马逊 (AMZN) 和英伟达 (NVDA) 的风险投资部门也参与了投资。英伟达和亚马逊的 AWS 云计算部门也与该初创公司合作,旨在尽快将其 AI 模型提供给部分客户。
生物技术目前是 AI 应用的热门领域。EvolutionaryScale 表示,其蛋白质工程工具可用于靶向癌细胞、发现新药以及设计能够分解环境中有害塑料的微生物,以及其他应用场景。Lux Capital 联合创始人兼管理合伙人 Josh Wolfe 将该初创公司称为“生物学的 ChatGPT 时刻”。
它是如何运作的?
与 AI 聊天机器人类似,EvolutionaryScale 的语言模型可以被提示生成蛋白质,该公司在其网站上发布的一篇名为“用语言模型模拟 5 亿年的进化”的预印本论文中表示,该模型可以“以思维链的方式”生成蛋白质。
该公司表示,今天发布的模型名为 ESM3,是在 27.8 亿个自然蛋白质数据上训练的。根据该论文,该模型“对蛋白质的序列、结构和功能进行推理”,并且可以“遵循结合其模态的复杂提示,并且对生物对齐高度敏感”。
当提示 ESM3 生成荧光蛋白时,该公司发现的生成物中,有一种荧光蛋白与已知的荧光蛋白相距甚远。类似的自然荧光蛋白在进化上相隔超过 5 亿年。“超过 30 亿年的进化已经产生了生物的图像,这些图像被编码到自然蛋白质的空间中。在这里,我们展示了在进化产生的标记上训练的语言模型可以充当进化模拟器,以生成与已知蛋白质相距甚远的具有功能的蛋白质。”该论文写道。
EvolutionaryScale 正在发布不同尺寸的 ESM3 模型。较小的模型将开源用于非商业研究,而 AWS 和英伟达将提供更大的模型用于商业用途。
更正:本文已更新,以反映参与 EvolutionaryScale 种子轮融资的是亚马逊,而不是亚马逊网络服务。