前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

NVIDIA 与 AWS 联手推进 AI 大规模部署

产品2026年6月23日· 原作者:Josiah Byers· 4 分钟阅读0 阅读

NVIDIA 与 AWS 宣布多项合作,包括推出搭载 RTX PRO 4500 Blackwell GPU 的 EC2 G7 实例,性能提升达 4.6 倍;将 GPU 加速的向量搜索作为 OpenSearch Serverless 默认选项,索引速度提升 10 倍,成本降低 75%;AWS 获得 NVIDIA GB300 训练工作负载的 Exemplar Cloud 认证,确保 AI 基础设施的优化性能。

大规模构建 AI 系统充满挑战,需要低延迟推理、快速向量搜索、强劲的 GPU 性价比,以及能够随业务增长而不增加运维复杂性的基础设施。

NVIDIA 与亚马逊云服务(AWS)的最新合作,正是为了解决这些痛点。通过 Amazon OpenSearch 和 Amazon EC2 的升级,NVIDIA AI 基础设施为企业提供了更务实的路径,助力其在生产环境中大规模部署 AI。

NVIDIA 与 AWS 合作主图

NVIDIA RTX PRO 4500 Blackwell GPU 驱动新 EC2 G7 实例

Amazon EC2 G7 实例搭载 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU,适用于 AI 推理、图形处理、空间计算和 GPU 加速数据分析。相比 G6 实例,G7 在 AI 推理性能上提升最高 4.6 倍,图形性能提升最高 2.1 倍,并借助 NVIDIA cuDF 库在 Apache Spark 工作负载上实现显著更快的 GPU 加速数据分析。

G7 实例支持最多 8 个 GPU、256GB 总 GPU 内存、700 Gbps EFA 网络,以及最高 7.6TB 本地 NVMe SSD 存储。配置涵盖 1、2、4、8 GPU 以及裸金属选项(即将推出),让客户能够按需调整基础设施规模,避免过度配置。

这一平台的多样性意味着 AI 团队能获得更低延迟的推理;媒体和娱乐团队可以处理高分辨率视频工作流和渲染;仿真、计算机辅助设计、虚拟桌面基础设施、游戏和空间计算团队能使用同一实例类型运行图形密集型应用;数据团队则可利用 GPU 内存、本地存储和网络改进来优化分析管道和向量数据库工作负载。

G7 实例可通过 AWS Deep Learning AMI、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS 和图形 AMI 访问,即将在 Amazon SageMaker AI 中上线。

NVIDIA cuVS 让 GPU 加速向量搜索成为 OpenSearch Serverless 默认选项

下一代 Amazon OpenSearch Serverless 为 AI 智能体和动态工作负载提供动力,无需管理基础设施。它采用 NVIDIA cuVS 驱动的 GPU 加速向量索引作为所有向量集合的默认计算选项。

对于构建检索增强生成(RAG)、语义搜索、推荐系统和 AI 智能体应用的团队而言,这一转变意义重大。GPU 驱动的向量搜索从一项需要专门优化的任务,变成了 AWS 的标准能力。

客户直接受益:向量索引速度最高提升 10 倍,成本仅为 CPU 构建的四分之一——这意味着十亿级向量数据库可以在不到一小时内构建完成。

通过将 NVIDIA cuVS 设为 OpenSearch Serverless 的默认方案,AWS 客户能从原始数据快速过渡到生产就绪的 AI 检索基础设施,且 serverless 的弹性扩展在工作负载空闲时降低了运维成本。

AWS 获得 NVIDIA GB300 训练工作负载的 Exemplar Cloud 认证

AWS 在 NVIDIA GB300 训练工作负载上达到了 NVIDIA Exemplar Cloud 状态。这意味着 AWS 满足了 NVIDIA 用于基准测试 AI 工作负载的严格性能阈值,与其参考架构保持一致。

这一成就源于 AWS 与 NVIDIA 团队的深度协同工程。通过 NVIDIA Exemplar Clouds 计划,开发者和 AI 领导者可以确信他们正在使用一致、高性能的云基础设施进行大规模训练,从而更自信地评估云提供商、优化总体拥有成本,并更高效地将 AI 项目从规划推进到生产。

这些进步共同强化了 AWS 上 AI 基础设施的每一层。核心逻辑始终如一:提供生产级的 AI 基础设施,性能强劲,同时不增加团队运营负担。

更多信息请参阅 AWS 博客。


原文链接:NVIDIA AI Blog
本文由前途科技编辑整理

标签:NVIDIAAWSBlackwell GPU云基础设施

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

Claude Tag 发布:团队协作新方式
TOP1

Claude Tag 发布:团队协作新方式

英伟达被禁AI芯片黑市价格翻倍
TOP2

英伟达被禁AI芯片黑市价格翻倍

3

Legion LegalTech 起诉美政府封禁 Anthropic 模型

1小时前
Legion LegalTech 起诉美政府封禁 Anthropic 模型
4

Meta监督委员会下令删除深度伪造视频并推动政策改革

1小时前
Meta监督委员会下令删除深度伪造视频并推动政策改革
5

AI内存短缺致DDR2价格飙升

1小时前
AI内存短缺致DDR2价格飙升
6

厄尔尼诺恐创历史最强,NASA拍下巨型暖波

1小时前
厄尔尼诺恐创历史最强,NASA拍下巨型暖波
7

官方确认Anthropic AI发现美国机密系统漏洞

1小时前
官方确认Anthropic AI发现美国机密系统漏洞
8

NVIDIA 与 AWS 联手推进 AI 大规模部署

13小时前
NVIDIA 与 AWS 联手推进 AI 大规模部署
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款