“`html
AI语言模型:递归能力的惊人突破
人工智能语言模型日新月异,其语言能力何时能与人类比肩,一直是备受关注的焦点。最新研究表明,这一时刻或许比我们想象的更近。
近期发表在《IEEE人工智能汇刊》上的研究显示,OpenAI的o1推理模型展现出对人类语言中最复杂现象之一——语言递归——的识别、建模甚至拓展能力。“湖中岛上的湖”就是一个递归的例子。研究共同作者,加州大学伯克利分校语言学副教授Gašper Beguš,致力于探究机器学习与人类学习的异同,并从安全和监管角度审视AI的局限性。
大型语言模型的元语言能力
研究团队评估了四种大型语言模型(LLM)的元语言能力:OpenAI的GPT-3.5 Turbo、GPT-4和o1,以及Meta的Llama 3.1。以往研究多关注模型的语言生成能力,而这项研究则侧重于模型分析语言的能力——元语言能力。例如,面对歧义句,“Eliza想要她的石膏取掉”,模型能否准确识别并理解其双重含义(移除石膏或逐出团体)?
结果显示,虽然所有四个模型都识别出句子的歧义结构,但只有o1能够准确解析出所有潜在含义。这体现了其对语言细微差别的敏锐捕捉。
递归能力:o1模型的显著优势
更令人瞩目的是o1在语言递归处理上的卓越表现。“世界观(尼采所作散文表达的)是前所未有的”就是一个递归句。o1不仅能识别递归句,还能准确绘制其句法树,甚至能在此基础上增加新的递归层级。在实验中,o1的得分高达0.87,远超其他模型的平均得分0.36。 这并非易事,即使对人类而言,分析此类复杂句式也极具挑战性。递归是人类语言的标志性特征,其复杂性是其他动物无法比拟的。AI模型能够识别和分析递归,标志着其语言能力达到了一个新的高度。
AI语言能力的边界在哪里?
研究还测试了模型分析语音规则的能力。实验使用人工语言,避免模型依赖记忆,而是分析词语结构本身。o1在30个案例中正确识别了19个语音规则,再次展现出其优越性。
Beguš教授强调,理解这些模型的语言能力极限至关重要,这关乎安全和监管。“它们已经达到了相当高的水平,”他指出,“但它们能走多远?能否分析三层、五层甚至十层递归?这才是百万美元的问题,也是我们研究的核心目标。”
“`