
OpenAI研究人员本周引发了竞争对手和数学家们的激烈批评,此前他们错误地声称其GPT-5模型已解决了此前未解的数学难题。然而,当事实证明该AI只是进行了复杂的文献检索时,OpenAI迅速撤回了这些断言。
夸大其词迅速破灭
这场争议始于OpenAI副总裁凯文·威尔(Kevin Weil)在社交媒体上发帖称,GPT-5“已找到10个此前未解的埃尔德什问题(Erdős problems)的解决方案,并在另外11个问题上取得了进展”。该帖子随后被威尔删除,但已由OpenAI研究员塞巴斯蒂安·布贝克(Sebastien Bubeck)转发并放大,布贝克当时宣称“通过AI加速科学的时代已正式开启”。
然而,这些声明很快就站不住脚。数学家托马斯·布鲁姆(Thomas Bloom),埃尔德什问题权威网站ErdősProblems.com的维护者,澄清说这些问题实际上并非“未解”。布鲁姆解释道,GPT-5找到了解决这些问题的参考文献,而他本人此前对此并不知情。他网站上“开放”的标注,仅仅意味着他个人当时不知道现有解决方案,并非指数学界普遍认为这些是活跃的研究前沿。
行业领袖强力反击
这一失误招致了OpenAI主要竞争对手的严厉斥责。诺贝尔奖获得者、Google DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)言简意赅地称之为“令人尴尬”。Meta首席人工智能科学家扬·勒昆(Yann LeCun)则提出了更为尖锐的批评,他将此情况描述为OpenAI“被自己的GPTards所害”——这是一个巧妙的法语双关语,玩味“自食恶果”(hoisted by your own petard)的说法。
布贝克最终承认了错误,承认“仅在文献中找到了解决方案”。然而,他试图挽回局面,辩称文献检索本身就具有挑战性,但这一说法并未打动批评者,他们指出这与OpenAI承诺的GPT-5突破性能力相去甚远。
竞争格局下的信誉质疑
此次事件凸显了AI行业内日益加剧的紧张局势,各公司正竞相展示其推理能力。今年,OpenAI和Google DeepMind都取得了实实在在的数学突破,两家公司的系统均在国际数学奥林匹克竞赛中获得了金牌分数。然而,虚假的埃尔德什问题声明,却有可能损害真正的科学进展。
这场争议反映了批评者眼中OpenAI一贯的“过度炒作”模式。正如一位行业观察家所指出的,“如果将文献检索与新知识的发现混为一谈,信誉必将受损。” 此次事件引发了人们对AI公司宣布数学发现时验证标准的质疑,尤其是在竞争激烈的AI领域,涉及数十亿美元的巨大风险。
