“`html
Zoom研发突破性AI推理技术:大幅降低成本,提升效率
Zoom通讯公司研究团队近日取得重大突破,开发出一项名为“草稿链”(Chain of Draft,CoD)的全新技术,有望彻底改变企业大规模部署AI的方式。这项技术能够显著降低人工智能系统处理复杂推理问题所需的计算资源和成本。
CoD技术让大型语言模型能够以极少的文字解决问题,其所需文本量仅为现有方法的7.6%,同时保持甚至提升了准确性。这项研究成果已于上周发表在arXiv预印本服务器上。
研究人员在论文中指出,CoD通过减少冗余信息,专注于关键洞察,在准确性方面与“思维链”(Chain of Thought,CoT)不相上下,甚至更胜一筹,同时仅使用了7.6%的标记,大幅降低了各种推理任务的成本和延迟。
CoD的灵感源于人类解决复杂问题的方式。我们解数学题或逻辑谜题时,通常不会事无巨细地写下所有步骤,而是只记录关键信息。CoD正是模拟了这种精简的思维过程,让大型语言模型专注于问题解决,避免冗余推理带来的额外开销。
研究团队在算术推理(GSM8k)、常识推理(日期理解和体育理解)以及符号推理(抛硬币任务)等多个基准测试中对CoD进行了测试。在一个引人注目的例子中,CoD在处理Claude 3.5 Sonnet体育相关问题时,平均输出从189.4个标记减少到仅14.3个标记,减少了92.4%,同时准确率从93.2%提高到97.3%。
AI研究员Ajith Vallath Prabhakar分析指出,对于每月处理100万个推理查询的企业而言,CoD可以将成本从3800美元(CoT)降低到760美元,每月节省超过3000美元。
这项研究对企业AI部署具有重大意义。随着企业越来越多地将复杂的AI系统集成到运营中,计算成本和响应时间已成为大规模采用的主要障碍。而CoD的简洁易用性,使其成为企业级AI应用的理想选择。
CoD的优势在于其简单的实施方式。与许多需要昂贵模型再训练或架构更改的AI技术不同,CoD可以通过简单的提示修改立即部署到现有模型中。企业只需简单修改提示,即可将CoT切换到CoD。
对于实时客户支持、移动AI、教育工具和金融服务等对延迟敏感的应用,CoD的价值尤为突出。即使是很小的延迟,也会显著影响用户体验。
业内专家认为,CoD的影响远不止成本节约。它使先进的AI推理技术更易于获取和负担得起,将使小型组织和资源受限的环境也能享受到先进AI能力带来的好处。
随着AI系统不断发展,像CoD这样的技术凸显了效率与原始能力并重的趋势。对于在快速变化的AI领域中发展的企业而言,此类优化可能与底层模型本身的改进一样重要。
研究代码和数据已在GitHub上公开发布,方便各组织使用自己的AI系统进行实施和测试。
“`