斯坦福报告：中美AI性能差距已基本消失

斯坦福大学周一发布了2026年人工智能指数报告，这份长达423页的评估报告对全球人工智能竞赛给出了一个引人瞩目的结论：美国与中国人工智能模型之间的性能差距几乎已荡然无存。截至2026年3月，美国顶尖模型在竞技场排行榜上仅比中国最强劲的对手领先2.7个百分点，斯坦福大学将这一差距定性为'实际上已消弭'。

该报告现已是第九版，被广泛视为衡量人工智能现状最全面的年度评估报告。报告发布之际，华盛顿和北京的政策制定者正竭力应对双方实力接近所带来的战略影响。十四个月前，中国初创公司深度求索（DeepSeek）推出的R1模型曾一度与美国顶级系统比肩，此后美中两国模型已多次交替领先。

Image 5: The rundown of U.S. and China relations - News - Missouri ...

差距缩小，但实力分布不均

尽管性能差距已大幅缩小，但两国的人工智能生态系统在表面之下呈现出截然不同的面貌。2025年，美国共推出50个值得关注的前沿模型，中国为30个；美国私人AI投资规模达2859亿美元，是中国124亿美元的逾23倍。然而，报告同时指出，仅凭私人融资数据会低估中国的实际总投入——自2000年以来，政府引导基金已累计向中国AI企业注资约1840亿美元。

与此同时，中国在AI学术论文发表量、引用份额、专利授权数量及工业机器人装机量等方面均已跻身全球首位。美国则在基础设施方面保持着显著优势——境内共有5427个数据中心，数量超过任何其他国家的10倍；而台积电（TSMC，台湾积体电路制造股份有限公司）几乎独家承担了全球顶尖AI芯片的生产制造。斯坦福大学人工智能指数报告

普及速度超越个人电脑与互联网

除地缘政治竞争外，该报告还记录了生成式AI重塑日常生活的惊人速度。生成式AI在三年内实现了全球53%的人口普及率，这一速度超过了个人电脑和互联网，但各国采用情况差异显著，且与人均GDP呈正相关。新加坡以61%的普及率位居首位，而美国以28.3%排名第24位。

企业机构的采用率已达88%，五分之四的大学生如今都在使用生成式AI。截至2026年初，生成式AI工具为美国消费者创造的估计年价值达1720亿美元，每位用户的中位价值在2025年至2026年间增长了两倍。斯坦福大学人工智能指数报告

卓越与盲区

报告还揭示了AI能力上的一个悖论。顶尖模型在博士级科学问题、多模态推理以及竞赛数学方面，如今已达到甚至超越了人类基准水平。谷歌旗下的Gemini Deep Think在国际数学奥林匹克竞赛中摘得金牌，SWE-bench编程基准测试的成绩也在一年内从60%飙升至接近100%。斯坦福大学人工智能指数报告

然而，最强的AI模型正确读取指针式时钟的概率仅为50.1%——几乎与抛硬币无异。AI智能体在OSWorld（一项测试真实计算机操作任务的基准）上的任务成功率从12%跃升至约66%，但在结构化基准测试中仍有约三分之一的尝试以失败告终。正如报告所言，AI的能力依然'参差不齐'——在许多人类专家都束手无策的任务上表现出色，却在连孩子都能轻松应对的问题上屡屡碰壁。斯坦福大学人工智能指数报告