前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 研究资源
    • 案例研究
    • 报告
    • 工具推荐
    • 术语词典
  • 服务
  • 关于
联系我们

英伟达 Blackwell Ultra 为 AI 推理带来 50 倍性能飞跃

技术2026年2月17日· 3 分钟阅读0 阅读

英伟达最新基准测试显示,搭载 Blackwell Ultra GPU 的 GB300 NVL72 系统在低延迟 AI 工作负载中,每兆瓦吞吐量提升高达 50 倍,每 token 成本相比上一代 Hopper 平台降低 35 倍。这一性能提升源于硬件架构改进与软件优化,各大云服务商已开始大规模部署,有望重塑 AI 部署经济学,推动智能体和编码助手等应用普及。

英伟达发布的最新基准测试数据显示,其搭载 Blackwell Ultra GPU 的 GB300 NVL72 系统在低延迟 AI 工作负载中,每兆瓦吞吐量提升高达 50 倍,每 token 成本相比该公司上一代 Hopper 平台降低 35 倍。这些性能提升使该硬件成为快速扩张的智能体 AI 应用和编码助手市场的领先解决方案。英伟达开发者博客

英伟达 Blackwell Ultra GPU 展示

架构改进推动性能提升

这一性能飞跃源于硬件进步与持续软件优化的结合。根据英伟达开发者博客,Blackwell Ultra Tensor Cores(超级张量核心)相比标准 Blackwell GPU 提供了 1.5 倍的计算性能,同时通过加速 softmax 执行,注意力层处理速度提升了一倍。这些架构改进直接解决了推理模型在处理大上下文窗口时所依赖的 transformer 注意力层的瓶颈问题。

该公司的 TensorRT-LLM 推理库在近几个月中性能稳步提升,SemiAnalysis 的基准测试显示,自 2025 年 10 月以来,在某些交互级别下单 GPU 吞吐量翻了一番。硬件和软件进步的结合实现了英伟达所描述的:相比 Hopper 架构,每用户每秒 token 数提升 10 倍,每兆瓦每秒 token 数提升 5 倍,最终实现 AI 工厂输出的综合 50 倍增长。SemiAnalysis 通讯

CoreWeave 公司工程高级副总裁 Chen Goldberg 表示:“随着推理成为 AI 生产的核心,长上下文性能和 token 效率变得至关重要。Grace Blackwell NVL72 直接应对了这一挑战。”

云服务商大规模部署

各大云服务商迅速推进了 GB300 NVL72 基础设施的部署。CoreWeave 于 2025 年宣布成为首家在生产环境中部署该系统的 AI 云服务商,并将其集成到基于 Kubernetes 的云堆栈中。微软部署了其所称的全球首个大规模 GB300 NVL72 超算集群,在经 Signal65 验证的测试中,单个机架实现了每秒超过 110 万个 token 的处理速度。CoreWeave 博客

甲骨文的 OCI 平台也在部署 GB300 NVL72 系统,计划将其超级集群扩展至超过 10 万个 Blackwell GPU,以满足推理工作负载日益增长的需求。雅虎财经

代币经济学重塑 AI 商业模式

成本的降低可能会重塑 AI 部署经济学。包括 Baseten、DeepInfra、Fireworks AI 和 Together AI 在内的领先推理服务提供商报告称,使用标准 Blackwell 平台可实现高达 10 倍的成本降低。Blackwell Ultra 平台进一步扩大了这些优势,针对需要低延迟的工作负载,每百万代币降低 35 倍的成本,使得 AI 代理和编码助手的大规模部署在经济上更加可行。TechBuzz

英伟达已经预览了其下一代 Rubin 平台的进一步改进,该公司表示该平台将在 Blackwell 的基础上再提升 10 倍性能。

标签:NVIDIABlackwell UltraAI 推理

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

欧盟发布AI法案高风险系统关键指南
TOP1

欧盟发布AI法案高风险系统关键指南

苹果播客全面支持视频,挑战YouTube和Spotify
TOP2

苹果播客全面支持视频,挑战YouTube和Spotify

3

科学家开发系统化方法,加速分子胶药物发现

2小时前
科学家开发系统化方法,加速分子胶药物发现
4

索尼推出AI音乐溯源技术,可识别训练数据来源

2小时前
索尼推出AI音乐溯源技术,可识别训练数据来源
5

阿里巴巴发布通义千问 3.5,专为自主 AI 智能体时代打造

2小时前
阿里巴巴发布通义千问 3.5,专为自主 AI 智能体时代打造
6

当AI走进面试间:顶尖人才的试金石,而非作弊者的通行证

2小时前
当AI走进面试间:顶尖人才的试金石,而非作弊者的通行证
7

马斯克真正的“王炸”:当xAI遇上星链

2小时前
马斯克真正的“王炸”:当xAI遇上星链
8

AI学会了伦勃朗的光,但读懂了人心吗?

1小时前
AI学会了伦勃朗的光,但读懂了人心吗?
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号