前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
科技

阿里巴巴AI大突破:Aegaeon系统GPU需求狂降82%!

NEXTECH
Last updated: 2025年10月20日 下午12:54
By NEXTECH
Share
6 Min Read
SHARE

Contents
应对AI运营中的资源效率挑战科技紧张局势下的战略意义

阿里巴巴集团控股公司近日宣布,在人工智能基础设施优化方面取得了重大突破。该公司推出了“Aegaeon”计算池化系统,能够将AI模型运行所需的英伟达GPU资源需求大幅削减82%。这项创新本周在韩国首尔举行的第31届操作系统原理研讨会(SOSP)上首次亮相,标志着这家中国科技巨头在全球AI效率领域占据领先地位,尤其是在中美科技紧张局势日益加剧的背景下,其战略意义更加凸显。

在阿里云的模型市场进行了为期三个月的内测期间,Aegaeon系统成功将GPU使用量从1,192块英伟达H20单元骤降至仅213块。在此期间,该系统同时支持了数十个参数规模高达720亿的模型运行。这一突破性进展使得单个GPU能够同时服务多达七个大型语言模型,并将模型切换延迟大幅缩短97%,极大地提升了AI推理服务的效率和响应速度。

应对AI运营中的资源效率挑战

该系统旨在解决云计算AI服务中长期存在的关键效率问题。研究人员发现,在阿里云的模型市场中,有17.7%的GPU资源被分配,却仅用于处理总推理请求的1.35%。来自北京大学和阿里云的研究人员指出:“Aegaeon是首次揭示市场上并发大型语言模型(LLM)工作负载所带来过高成本的研究成果。”这一发现凸显了优化AI资源分配的紧迫性。

阿里云首席技术官、ACM会士及该研究论文的共同作者周靖人,主导了这项创新技术的研发工作。Aegaeon系统在模型推理过程中实现了令牌级别的自动扩缩容,从而能够进行动态资源重新分配。这意味着GPU可以在处理任务中途,灵活地在不同模型之间进行切换,显著提高了硬件利用率和整体效率。

科技紧张局势下的战略意义

这项突破性进展的公布正值中国全力以赴提升技术自主能力的关键时期。英伟达首席执行官黄仁勋近期透露,由于美国的贸易限制,其公司在中国高端AI芯片市场的份额已从95%骤降至零。中国相关部门已指示包括阿里巴巴和字节跳动在内的国内企业,在可能的情况下避免采购英伟达芯片,并转而聚焦于国内替代方案的研发与应用。

You Might Also Like

澳大利亚公司 NYBlue 收购了超过一百万克拉的蓝色锆石,并推出了 RWA 代币
亚马逊Blink安全摄像头App短暂故障后迅速修复
微软AI巨变:MAI团队剑指医疗超级智能,诊断力超医生
The Tie 在 The Tie 终端上推出 Polkadot 生态系统仪表板
阿里巴巴的这项技术突破,不仅巩固了中国在全球AI竞争中的地位,更有效降低了对美国半导体技术的依赖。该公司已确认,Aegaeon系统目前已正式部署在其“百炼”模型市场中,为企业客户提供阿里巴巴自研的通义千问(Qwen)系列模型服务。
TAGGED:AI技术GPU优化大模型科技自立阿里巴巴
Share This Article
Email Copy Link Print
Previous Article 20251020122910157.jpg 苹果CEO库克访华:AI战略、贸易合作与市场深耕
Next Article 20251020131934314.jpg 阿里京东稳定币计划遭中国叫停:监管重压下的数字货币未来?
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
拥抱AI的“人性化”愿景:工具而非替代品
AI
图1:决策树分类器在Excel中的示例
机器学习决策树分类器全解析:从基尼系数到Excel实战
未分类
X平台标志与欧盟旗帜
欧盟重罚X平台1.2亿欧元,马斯克强硬反击:关闭其广告账户
科技
《战略数据科学家:在AI时代进阶与成长》书籍封面
破解数据科学晋升密码:从L3到L6,你需要的是思维跃迁,而非技术堆叠
职业发展与学习路径

相关内容

20250930122027137.jpg
科技

OpenAI Sora 2来袭:AI短视频社交,能否颠覆TikTok格局?

2025年9月30日
20250923131902459.jpg
科技

特斯拉Cyber SUV或将面世?设计总监确认探索新车型

2025年9月23日
20251122112610897.jpg
科技

地球等离子层遭超级风暴压缩,卫星防护面临挑战

2025年11月22日
20251106093206181.jpg
科技

深空合作新里程:Rocket Lab助iQPS再部署,展望2025年

2025年11月6日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up