NVIDIA新AI软件加速材料模拟与天文发现

本周在汉堡举行的 ISC 大会上，NVIDIA 推出了一系列新软件，加速从化学、材料发现到暗物质搜索等领域的 AI 科学应用。

NVIDIA DAQIRI 库、全新 NVIDIA ALCHEMI NIM 微服务以及即将推出的 NVIDIA cuPhoton 参考代码，将原本需要 CPU 数小时甚至数天的工作，转变为实时的 GPU 加速流水线。

它们是 NVIDIA CUDA-X 的一部分，这是一套工具和库集合，可在 AI 和高性能计算等领域提供显著更高的性能。

这些性能提升巨大且影响深远。科学家们正在利用 AI 和加速计算，以比以往更快的速度从仪器和观测中产生数据和洞察。

例如，在 NVIDIA GB200 NVL72 系统上运行的 cuPhoton，可加速从天文台和望远镜加载、读取、处理和分析 FITS 数据（标准天文文件格式）。在早期访问中，cuPhoton 将鲁宾天文台 Legacy Survey of Space and Time（LSST）采集的 FITS 图像加载和读取速度提升了 14,900 倍。使用 32 个 NVIDIA Grace Blackwell 超级芯片，它还实现了高达 8,400 倍更快的信号处理和分析。

最终，这意味着从 LSST 相机——有史以来最大的数码相机——更快地获取洞察，该相机拍摄了数十亿个遥远星系以及较近的、反射光线较少的暗弱天体的图像。

视频 3

从实验室到望远镜：新软件加速研究

新软件加速了暗物质研究、材料模拟等多个领域。

NVIDIA cuPhoton 是一个参考代码，供科学家从望远镜、X 射线和激光实验收集的多维数据中提取洞察。它专为加载、处理、分析和可视化 PB 级数据而构建，可与其他 NVIDIA CUDA-X 技术一起使用，构建用于天体物理学和天文学等领域端到端的加速流水线。

普林斯顿大学的研究人员与 NVIDIA 合作开发了 cuPhoton，并将与哈佛大学一起用于处理和分析天文台和暗能量巡天收集的海量数据。

NVIDIA DAQIRI（全称 Data Acquisition for Integrated Real-time Instruments）是一个高性能网络库，可将来自快速探测器和传感器的数据流传输到 NVIDIA 软件中。旧系统绑定在固定硬件上，当仪器产生数据的速度超过保存速度时，可能会丢失数据。DAQIRI 通过处理实时到达的数据流来跟上速度。

一个名为 A-GHOST 的研究项目由来自 CERN、芝加哥大学和伦敦大学学院的科学家在 CERN openlab 框架内开发。它使用 DAQIRI 在 CERN ATLAS 实验记录的碰撞数据上实时运行 AI。A-GHOST 分析通常会被 ATLAS 拒绝的数据——由于存储限制，超过 99% 的数据会被丢弃——从而能够捕获可能被错过的有趣信号。

NVIDIA ALCHEMI 包含一系列特定领域的微服务和一个工具包，用于加速化学和材料发现，应用涵盖电池材料、催化剂、OLED 显示器、美容产品等。

NVIDIA 于 3 月发布了两个 ALCHEMI NIM 微服务：批处理几何弛豫（BGR）和批处理分子动力学（BMD）。这些 AI 加速工具让研究人员能够同时模拟数百万个分子和材料：BGR 用于寻找最稳定的结构，BMD 用于模拟它们随时间推移的运动。

此外，ALCHEMI 预计很快将包括一个广泛使用的维也纳从头算模拟包（VASP）微服务，使研究人员能够以更高的 GPU 吞吐量运行材料模拟。通过使用 NVIDIA Multi-Process Service 在单个 GPU 上运行多个 VASP 计算，该微服务实现了几何优化（寻找材料中最稳定的原子排列过程）3 倍的加速。

此外，开发者和研究人员可以使用 ALCHEMI Toolkit 加速训练称为机器学习原子间势的 AI 代理模型，并轻松构建自定义的高性能原子模拟工作流。

Lila Sciences如何使用NVIDIA ALCHEMI不间断运行科学方法

Lila Sciences 正在构建一个科学超级智能平台和自主实验室，涵盖生命科学、化学和材料科学。它与 NVIDIA 合作，使用 ALCHEMI 进行了高保真磁模拟，并在 3 月的 NVIDIA GTC San Jose 上进行了演示。

Lila Sciences 使用 ALCHEMI NIM 微服务（BGR）将高通量材料筛选加速了 50 倍，识别出有更高合成可能性的稳定候选材料。然后，它使用早期访问中的 ALCHEMI VASP 微服务，将候选材料的磁性能计算加速了 30%。

Lila Sciences 使用 NVIDIA ALCHEMI 进行材料模拟示意图

Lila Sciences 使用 NVIDIA ALCHEMI 进行材料模拟。上图由 Lila Sciences 提供，展示了从溅射仪合成样品中切割出的薄膜样板。

加速效果相互叠加。ALCHEMI 专为 TensorNet 设计的内核使 Lila 在训练和推理方面获得了 6 倍的加速，并将内存使用减少了 3 倍，从而使以前需要数周的模拟在短短几天内完成。

这种方法不是一次运行一个实验，而是在 GPU 内存中同时评估多种材料，并可推广到以下用例：

材料发现——大规模筛选新型稳定成分
能源——发现活性丰富的地球催化剂，用于生产化学品和燃料
电磁学——理解和预测复杂的磁行为

ALCHEMI 位于模拟层，生成物理科学数据，为循环的其余部分提供输入。

此外，Lila Sciences 使用完整的 NVIDIA 堆栈加速科学发现，包括用于训练的 NVIDIA Megatron-LM 和 NVIDIA Nemotron（包括 Nemotron 3 Nano 和 Nemotron 3 Super 开放模型，以及 NeMo RL 和 NeMo Gym 库）。该公司还利用 NVIDIA BioNeMo 进行分子生成、NVIDIA Triton 和 NIM 微服务进行推理服务，以及 NVIDIA Omniverse 库用于数字孪生。

“这项工作展示了使用强大的计算堆栈来加速发现，其规模是任何单个科学家都无法单独实现的，”Lila Sciences 联合创始人兼首席技术官 Andy Beam 表示。