NVIDIA 与 AWS 联手推进 AI 大规模部署

产品2026年6月23日· 原作者：Josiah Byers· 4 分钟阅读0 阅读

NVIDIA 与 AWS 宣布多项合作，包括推出搭载 RTX PRO 4500 Blackwell GPU 的 EC2 G7 实例，性能提升达 4.6 倍；将 GPU 加速的向量搜索作为 OpenSearch Serverless 默认选项，索引速度提升 10 倍，成本降低 75%；AWS 获得 NVIDIA GB300 训练工作负载的 Exemplar Cloud 认证，确保 AI 基础设施的优化性能。

大规模构建 AI 系统充满挑战，需要低延迟推理、快速向量搜索、强劲的 GPU 性价比，以及能够随业务增长而不增加运维复杂性的基础设施。

NVIDIA 与亚马逊云服务（AWS）的最新合作，正是为了解决这些痛点。通过 Amazon OpenSearch 和 Amazon EC2 的升级，NVIDIA AI 基础设施为企业提供了更务实的路径，助力其在生产环境中大规模部署 AI。

NVIDIA 与 AWS 合作主图

NVIDIA RTX PRO 4500 Blackwell GPU 驱动新 EC2 G7 实例

Amazon EC2 G7 实例搭载 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU，适用于 AI 推理、图形处理、空间计算和 GPU 加速数据分析。相比 G6 实例，G7 在 AI 推理性能上提升最高 4.6 倍，图形性能提升最高 2.1 倍，并借助 NVIDIA cuDF 库在 Apache Spark 工作负载上实现显著更快的 GPU 加速数据分析。

G7 实例支持最多 8 个 GPU、256GB 总 GPU 内存、700 Gbps EFA 网络，以及最高 7.6TB 本地 NVMe SSD 存储。配置涵盖 1、2、4、8 GPU 以及裸金属选项（即将推出），让客户能够按需调整基础设施规模，避免过度配置。

这一平台的多样性意味着 AI 团队能获得更低延迟的推理；媒体和娱乐团队可以处理高分辨率视频工作流和渲染；仿真、计算机辅助设计、虚拟桌面基础设施、游戏和空间计算团队能使用同一实例类型运行图形密集型应用；数据团队则可利用 GPU 内存、本地存储和网络改进来优化分析管道和向量数据库工作负载。

G7 实例可通过 AWS Deep Learning AMI、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS 和图形 AMI 访问，即将在 Amazon SageMaker AI 中上线。

NVIDIA cuVS 让 GPU 加速向量搜索成为 OpenSearch Serverless 默认选项

下一代 Amazon OpenSearch Serverless 为 AI 智能体和动态工作负载提供动力，无需管理基础设施。它采用 NVIDIA cuVS 驱动的 GPU 加速向量索引作为所有向量集合的默认计算选项。

对于构建检索增强生成（RAG）、语义搜索、推荐系统和 AI 智能体应用的团队而言，这一转变意义重大。GPU 驱动的向量搜索从一项需要专门优化的任务，变成了 AWS 的标准能力。

客户直接受益：向量索引速度最高提升 10 倍，成本仅为 CPU 构建的四分之一——这意味着十亿级向量数据库可以在不到一小时内构建完成。

通过将 NVIDIA cuVS 设为 OpenSearch Serverless 的默认方案，AWS 客户能从原始数据快速过渡到生产就绪的 AI 检索基础设施，且 serverless 的弹性扩展在工作负载空闲时降低了运维成本。

AWS 获得 NVIDIA GB300 训练工作负载的 Exemplar Cloud 认证

AWS 在 NVIDIA GB300 训练工作负载上达到了 NVIDIA Exemplar Cloud 状态。这意味着 AWS 满足了 NVIDIA 用于基准测试 AI 工作负载的严格性能阈值，与其参考架构保持一致。

这一成就源于 AWS 与 NVIDIA 团队的深度协同工程。通过 NVIDIA Exemplar Clouds 计划，开发者和 AI 领导者可以确信他们正在使用一致、高性能的云基础设施进行大规模训练，从而更自信地评估云提供商、优化总体拥有成本，并更高效地将 AI 项目从规划推进到生产。

这些进步共同强化了 AWS 上 AI 基础设施的每一层。核心逻辑始终如一：提供生产级的 AI 基础设施，性能强劲，同时不增加团队运营负担。