NVIDIA在ISC大会上推出DAQIRI、ALCHEMI NIM微服务和cuPhoton等新软件,将科学计算中原本需要数小时甚至数天的工作提速至实时GPU加速流水线,助力暗物质研究、材料发现等领域的突破。
本周在汉堡举行的 ISC 大会上,NVIDIA 推出了一系列新软件,加速从化学、材料发现到暗物质搜索等领域的 AI 科学应用。
NVIDIA DAQIRI 库、全新 NVIDIA ALCHEMI NIM 微服务以及即将推出的 NVIDIA cuPhoton 参考代码,将原本需要 CPU 数小时甚至数天的工作,转变为实时的 GPU 加速流水线。
它们是 NVIDIA CUDA-X 的一部分,这是一套工具和库集合,可在 AI 和高性能计算等领域提供显著更高的性能。
这些性能提升巨大且影响深远。科学家们正在利用 AI 和加速计算,以比以往更快的速度从仪器和观测中产生数据和洞察。
例如,在 NVIDIA GB200 NVL72 系统上运行的 cuPhoton,可加速从天文台和望远镜加载、读取、处理和分析 FITS 数据(标准天文文件格式)。在早期访问中,cuPhoton 将鲁宾天文台 Legacy Survey of Space and Time(LSST)采集的 FITS 图像加载和读取速度提升了 14,900 倍。使用 32 个 NVIDIA Grace Blackwell 超级芯片,它还实现了高达 8,400 倍更快的信号处理和分析。
最终,这意味着从 LSST 相机——有史以来最大的数码相机——更快地获取洞察,该相机拍摄了数十亿个遥远星系以及较近的、反射光线较少的暗弱天体的图像。
新软件加速了暗物质研究、材料模拟等多个领域。
NVIDIA cuPhoton 是一个参考代码,供科学家从望远镜、X 射线和激光实验收集的多维数据中提取洞察。它专为加载、处理、分析和可视化 PB 级数据而构建,可与其他 NVIDIA CUDA-X 技术一起使用,构建用于天体物理学和天文学等领域端到端的加速流水线。
普林斯顿大学的研究人员与 NVIDIA 合作开发了 cuPhoton,并将与哈佛大学一起用于处理和分析天文台和暗能量巡天收集的海量数据。
NVIDIA DAQIRI(全称 Data Acquisition for Integrated Real-time Instruments)是一个高性能网络库,可将来自快速探测器和传感器的数据流传输到 NVIDIA 软件中。旧系统绑定在固定硬件上,当仪器产生数据的速度超过保存速度时,可能会丢失数据。DAQIRI 通过处理实时到达的数据流来跟上速度。
一个名为 A-GHOST 的研究项目由来自 CERN、芝加哥大学和伦敦大学学院的科学家在 CERN openlab 框架内开发。它使用 DAQIRI 在 CERN ATLAS 实验记录的碰撞数据上实时运行 AI。A-GHOST 分析通常会被 ATLAS 拒绝的数据——由于存储限制,超过 99% 的数据会被丢弃——从而能够捕获可能被错过的有趣信号。
NVIDIA ALCHEMI 包含一系列特定领域的微服务和一个工具包,用于加速化学和材料发现,应用涵盖电池材料、催化剂、OLED 显示器、美容产品等。
NVIDIA 于 3 月发布了两个 ALCHEMI NIM 微服务:批处理几何弛豫(BGR)和批处理分子动力学(BMD)。这些 AI 加速工具让研究人员能够同时模拟数百万个分子和材料:BGR 用于寻找最稳定的结构,BMD 用于模拟它们随时间推移的运动。
此外,ALCHEMI 预计很快将包括一个广泛使用的维也纳从头算模拟包(VASP)微服务,使研究人员能够以更高的 GPU 吞吐量运行材料模拟。通过使用 NVIDIA Multi-Process Service 在单个 GPU 上运行多个 VASP 计算,该微服务实现了几何优化(寻找材料中最稳定的原子排列过程)3 倍的加速。
此外,开发者和研究人员可以使用 ALCHEMI Toolkit 加速训练称为机器学习原子间势的 AI 代理模型,并轻松构建自定义的高性能原子模拟工作流。
Lila Sciences 正在构建一个科学超级智能平台和自主实验室,涵盖生命科学、化学和材料科学。它与 NVIDIA 合作,使用 ALCHEMI 进行了高保真磁模拟,并在 3 月的 NVIDIA GTC San Jose 上进行了演示。
Lila Sciences 使用 ALCHEMI NIM 微服务(BGR)将高通量材料筛选加速了 50 倍,识别出有更高合成可能性的稳定候选材料。然后,它使用早期访问中的 ALCHEMI VASP 微服务,将候选材料的磁性能计算加速了 30%。

Lila Sciences 使用 NVIDIA ALCHEMI 进行材料模拟。上图由 Lila Sciences 提供,展示了从溅射仪合成样品中切割出的薄膜样板。
加速效果相互叠加。ALCHEMI 专为 TensorNet 设计的内核使 Lila 在训练和推理方面获得了 6 倍的加速,并将内存使用减少了 3 倍,从而使以前需要数周的模拟在短短几天内完成。
这种方法不是一次运行一个实验,而是在 GPU 内存中同时评估多种材料,并可推广到以下用例:
ALCHEMI 位于模拟层,生成物理科学数据,为循环的其余部分提供输入。
此外,Lila Sciences 使用完整的 NVIDIA 堆栈加速科学发现,包括用于训练的 NVIDIA Megatron-LM 和 NVIDIA Nemotron(包括 Nemotron 3 Nano 和 Nemotron 3 Super 开放模型,以及 NeMo RL 和 NeMo Gym 库)。该公司还利用 NVIDIA BioNeMo 进行分子生成、NVIDIA Triton 和 NIM 微服务进行推理服务,以及 NVIDIA Omniverse 库用于数字孪生。
“这项工作展示了使用强大的计算堆栈来加速发现,其规模是任何单个科学家都无法单独实现的,”Lila Sciences 联合创始人兼首席技术官 Andy Beam 表示。
NVIDIA ALCHEMI Toolkit 和 Toolkit-Ops 可从 Github 和 PyPI 下载。ALCHEMI NIM 微服务可从 NVIDIA NGC 目录下载。用于 VASP 的 ALCHEMI NIM 微服务预计将于今年夏末推出。
DAQIRI 现已从 GitHub 获取。CuPhoton 预计将于今年夏季推出。
原文链接:NVIDIA AI Blog
本文由前途科技编辑整理
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断