NVIDIA AI云生态系统正在全球范围内加速AI工厂建设,合作伙伴扩展基础设施以满足智能体AI和物理AI的Token需求。通过采用NVIDIA全栈技术,这些云服务将AI计算能力带到区域市场,支持主权AI并降低延迟。最新进展包括Firmus在亚太的扩展、CoreWeave和Nebius推出物理AI工作台等。

NVIDIA AI云生态系统正加速全球AI工厂基础设施建设。合作伙伴持续扩大容量,以应对企业、初创公司、国家、AI实验室和开发者在可扩展智能体AI应用方面日益增长的需求。
NVIDIA AI云是一个不断壮大的专用云生态系统,服务于当今最热门AI应用背后的海量Token需求。这些AI云与NVIDIA全栈AI基础设施共同设计,以满足企业、初创公司和国家对新增供应商及区域容量的迫切需求。
它们结合了NVIDIA加速计算、网络和AI软件,帮助合作伙伴支持训练、微调、推理、智能体AI、物理AI和主权AI部署。具体配置因合作伙伴和工作负载而异。
AI云合作伙伴选择NVIDIA,是因为其最佳经济效益——最低的Token成本、每瓦最佳吞吐量——用于运行前沿和开源AI。这些云采用NVIDIA加速计算、网络和AI软件构建,将AI工厂带到数据、开发者、用户和行业更近的地方,帮助客户大规模训练、调优和运行智能体AI应用。该生态系统几乎覆盖每个地理区域,支持前沿模型构建者、企业、初创公司、软件提供商和国家AI计划所需的区域和主权AI能力。
“每家公司、每个国家都需要AI工厂基础设施,将数据转化为智能,”NVIDIA创始人兼CEO黄仁勋表示。“NVIDIA AI云将全栈AI工厂带到区域、行业和开发者更近的地方,他们正在构建下一代AI——从模型训练到实时推理,以及将改变个人和组织工作方式的AI智能体。”
AI云提供商、电信公司、主权AI构建者和垂直整合基础设施提供商正在与NVIDIA共同建设AI工厂,服务前沿AI、企业AI、电信、开发者云和国家AI计划等客户。
区域增长正在加速,覆盖东南亚、澳大利亚和美洲。随着Cassava(非洲)和Claro(南美)的加入,NVIDIA AI云现已覆盖六大洲。
NVIDIA AI云将大规模AI工厂建设与领先AI实验室、企业、政府和数字服务提供商的需求相结合。合作伙伴包括CoreWeave、Firmus、IREN和Nscale等,正在扩展AI基础设施以支持前沿模型开发、企业AI、智能体应用和高容量推理。
在各区域,NVIDIA AI云将AI工厂带到本地产业和主权AI生态系统附近。合作伙伴包括Firebird、GMI Cloud、Indosat Ooredoo Hutchison、Lambda、Naver Cloud、Sharon AI、Yotta和YTL等,支持新兴AI公司、国家AI计划、金融服务、电信、制造、教育、医疗和开发者生态系统。
对于政府和受监管行业,区域AI云可以支持主权控制和本地合规要求。对于开发者和企业,则可以降低访问加速基础设施的摩擦,用于AI智能体、企业Copilot、数字工作者等必须靠近用户和数据运行的AI服务。
Firmus在澳大利亚和亚太地区扩展AI工厂足迹
Firmus Technologies正在南澳大利亚和东南亚扩展其AI工厂足迹,建设节能基础设施以支持大规模训练、推理和智能体AI工作负载的增长需求。
通过Project Southgate项目,Firmus在塔斯马尼亚、墨尔本、南澳大利亚和新南威尔士开发AI工厂,重点采用可再生能源、先进冷却和模块化基础设施,以更快上线。该公司还通过与ST Telemedia Global Data Centres合作,在新加坡部署了AI基础设施。
Firmus在其建设中采用NVIDIA加速计算和参考架构,NVIDIA DSX帮助简化AI工厂设计、部署和运营。
与NVIDIA DSX平台保持一致设计的液冷Firmus HyperCube,旨在加速模块化AI工厂建设,并优化低Token成本。Firmus在AI工厂供应链各环节创新,包括冷却和能源。
“AI智能体正在创造对Token的工业级新需求,亚太地区需要能够更快建设、更高效液冷、运行在千兆瓦规模的AI工厂,”Firmus联合CEO Tim Rosenfield表示。“与NVIDIA一起,Firmus正在建设液冷AI基础设施,为地区最重要客户尽可能高效快速地交付AI Token。”
CoreWeave推进物理AI和下一代AI工厂
CoreWeave正在扩展其NVIDIA AI云平台,以支持下一波智能体AI、物理AI和前沿模型工作负载。
作为NVIDIA Vera Rubin和NVIDIA Vera CPU的早期采用者,CoreWeave也是首批采用NVIDIA Spectrum-X Ethernet Photonics的厂商之一,为百万GPU规模的AI工厂提供网络基础。CoreWeave正在将平台扩展至机器人和物理AI工作流,包括使用NVIDIA Cosmos 3——最新前沿世界基础模型——帮助团队生成合成数据、微调模型并加速机器人数据飞轮。包括Anthropic在内的领先AI实验室在CoreWeave基础设施上构建和扩展前沿模型。
“AI工厂正成为智能体时代的基础,”CoreWeave联合创始人、董事长兼CEO Michael Intrator表示。“与NVIDIA一起,CoreWeave正在构建全栈云基础设施,为AI实验室、企业和开发者提供将前沿模型、AI智能体和物理AI系统转化为生产应用所需的性能、规模和可靠性。”
Nebius为智能体工作流构建开放物理AI工作台
Nebius正在扩展其NVIDIA AI云,提供用于训练、推理和物理AI开发的全栈平台。
作为NVIDIA Vera Rubin的早期采用者,Nebius正在构建从芯片到软件的集成AI基础设施,包括Nebius AI云、Token Factory推理层和新的Physical AI Workbench。该工作台将NVIDIA Cosmos 3、NVIDIA Isaac Sim和Isaac GR00T等技术整合为可由AI智能体组装的可组合工作流,帮助机器人和自主系统团队更快地从仿真和合成数据过渡到训练和评估。
“开发者应该能够构建AI系统,而无需花数周整合基础设施,”Nebius创始人兼CEO Arkady Volozh表示。“借助NVIDIA,Nebius正在创建一个AI云,AI智能体可以组合所需工具、数据和计算,加速从机器人、生命科学到企业的AI工作负载——从实验到生产。”
NVIDIA Exemplar云势头
自NVIDIA去年推出Exemplar云以来,已有六家NVIDIA云合作伙伴获得Exemplar云状态:CoreWeave、Crusoe、Lambda、Nebius、Vultr和YTL。不断增长的名单反映了对能够为生产AI工作负载提供一致性能、可靠性和效率的AI云基础设施的需求。
这些提供商正在帮助提升AI云生态系统的性能标杆,为企业、开发者和AI实验室提供更多经过验证的选项,用于扩展训练、推理和智能体AI服务。
专为AI工厂经济学设计
随着AI从模型开发转向推理和高容量推理,基础设施的衡量标准不再只是宣布的容量,还包括Token产出的经济性——由平台利用率、正常运行时间、资产寿命以及人们可部署的有用AI智能体的广度和深度驱动。
基于NVIDIA全栈AI工厂平台构建的AI云,帮助合作伙伴针对这些指标优化基础设施。
每Token成本是直接考虑硬件性能、软件优化、生态系统支持和实际利用率的总体拥有成本指标。NVIDIA通过Token吞吐量、软件优化以及跨计算、网络、内存和存储的全栈协同设计,实现了行业最低的每Token成本。
DSX帮助AI云更快上线
NVIDIA AI云正在采用NVIDIA DSX平台来设计、构建和运营AI工厂。
DSX整合了经过验证的参考设计、仿真、软件和生态系统技术,帮助云提供商更快上线、更高效运营并最大化收入。
DSX Sim帮助团队在部署前建模和验证AI工厂。DSX Flex帮助AI工厂动态适应电网条件。DSX MaxLPS帮助受电力限制的AI工厂在固定电力预算内最大化计算能力,最多可增加40%的GPU。DSX OS帮助自动化生命周期管理和大规模运营。
DSX帮助AI云降低部署风险、提高弹性、每瓦交付更多Token,并实现最低Token成本。
原文链接:NVIDIA AI Blog
本文由前途科技编辑整理
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断