苹果计划在即将推出的Siri升级中使用Nvidia机密计算技术,通过Google Cloud处理复杂AI查询,同时利用Gemini模型进行蒸馏,实现在设备端运行。此举在保障隐私的同时,降低了成本。
据科技媒体《The Information》报道,苹果将在其即将推出的Siri重大升级中,在Google Cloud内使用Nvidia的机密计算技术来处理复杂的AI查询,同时仍计划保留“Private Cloud Compute”品牌。
报道称,苹果正在蒸馏Google的Gemini大模型——训练出一个足够小的版本,能够直接在iPhone等苹果硬件上本地运行——而较重的查询则通过搭载Nvidia GPU的Google Cloud基础设施进行处理。据知情人士透露,苹果“在最近几周”批准了使用Nvidia的机密计算功能。

Nvidia的机密计算是其GPU内置的安全功能,在数据处理过程中对数据和AI模型进行加密,确保Google或其他第三方在推理过程中无法访问用户信息。该技术会带来一定的性能开销,但为使用中的数据提供了更强的保护,使得苹果即使在查询经过第三方基础设施时也能坚守其隐私承诺。
这一安排标志着苹果最初的Private Cloud Compute系统发生了显著变化——此前该系统完全运行在苹果自研芯片和苹果控制的服务器上。尽管架构上转向了Google云,但据知情人士透露,苹果预计将继续在其下一代Apple Intelligence功能中使用“Private Cloud Compute”品牌。
苹果的总体策略是:使用Google Gemini大模型作为“教师”,通过蒸馏过程训练较小的“学生”模型——这一过程将大模型的推理能力压缩到足够小,以便在设备端运行。这种方法让苹果能够在自研芯片上本地提供先进的AI功能,同时将云端处理保留给最复杂的请求。
这些消息正值苹果准备在下个月的WWDC上展示其设备端AI能力之际。预计苹果将强调,15年的自研芯片开发经验使其在设备端运行AI模型方面具有优势。苹果将把本地推理定位为一种既能保护隐私又能节省成本的替代方案,以区别于其他公司所追求的数据中心扩张。
这项为期多年的苹果与Google合作始于2026年1月,确立了Gemini作为苹果下一代模型的基础。据估计,苹果每年为此支付约10亿美元。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断