2025 年企业 AI 的五大关键趋势
2025 年将是企业 AI 的一个关键年份。过去一年见证了 AI 技术的快速发展,今年将继续保持这一势头。因此,企业需要重新审视其 AI 战略,以保持竞争力并为客户创造价值。从扩展 AI 代理到优化成本,以下五个关键领域是企业今年 AI 战略的重中之重。
1. AI 代理:从理论走向现实
AI 代理不再是理论上的概念,它们已成为企业优化运营和增强客户互动不可或缺的工具。与传统软件不同,由大型语言模型 (LLM) 驱动的代理能够做出细致入微的决策,处理复杂的、多步骤的任务,并与工具和 API 无缝集成。
2024 年初,代理尚未成熟,经常出现令人沮丧的错误,例如幻觉 URL。随着前沿大型语言模型本身的改进,代理开始变得更加出色。
“让我这么说吧,”Red Dragon 的联合创始人 Sam Witteveen 说,Red Dragon 是一家为企业开发代理的公司,该公司最近回顾了去年构建的 48 个代理。“有趣的是,我们在年初构建的那些代理,到年底运行得更好,仅仅是因为模型得到了改进。”Witteveen 在我们拍摄的视频播客中分享了这一观点,详细讨论了这五个重大趋势。
模型正在变得越来越好,幻觉越来越少,它们也正在接受训练以执行代理任务。模型提供商正在研究的另一个功能是使用 LLM 作为评判者,随着模型变得更便宜(我们将在下面讨论),公司可以使用三个或更多模型来挑选最佳输出,以做出决策。
另一个秘诀是什么?检索增强生成 (RAG) 正在变得越来越好,它允许代理有效地存储和重用知识。想象一下,一个旅行代理机器人不仅可以规划行程,还可以根据更新的偏好和预算实时预订航班和酒店。
要点:企业需要确定 AI 代理能够提供高 ROI 的用例,无论是在客户服务、销售还是内部工作流程中。工具使用和高级推理能力将决定该领域的赢家。
2. 评估:确保 AI 与目标一致
评估是任何稳健的 AI 部署的基石。这个过程包括从数百种可用的 LLM 中选择最适合您的任务的 LLM。这对于准确性至关重要,但也与将 AI 输出与企业目标保持一致有关。良好的评估可以确保聊天机器人理解语气,推荐系统提供相关选项,预测模型避免代价高昂的错误。
例如,公司对客户支持聊天机器人的评估可能包括平均解决时间、响应准确性和客户满意度评分等指标。
许多公司一直在投入大量时间来处理输入和输出,以使其符合公司的期望和工作流程,但这可能需要大量时间和资源。随着模型本身的改进,许多公司通过更多地依赖模型本身来完成工作来节省精力,因此选择合适的模型变得更加重要。
这个过程正在迫使清晰的沟通和更好的决策。当您“更加意识到如何评估某事物的输出以及您真正想要什么时,这不仅使您在 LLM 和 AI 方面变得更好,而且实际上使您在与人类的互动中变得更好,”Witteveen 说。“当您能够清楚地向人类表达:这是我想要的,这是我希望它看起来的样子,这是我期望它包含的内容。当您对此变得非常具体时,人类的执行力会突然提高很多。”
Witteveen 指出,公司经理和其他开发人员告诉他:“哦,你知道,仅仅通过精通提示工程或精通编写模型的正确评估,我在向团队下达指示方面已经变得好多了。”
通过编写清晰的评估,企业迫使自己澄清目标,这对人和机器都是双赢。
要点:创建高质量的评估至关重要。从清晰的基准开始:响应准确性、解决时间和与业务目标的一致性。这确保您的 AI 不仅能够执行,而且与您的品牌价值观保持一致。
3. 成本优化:AI 变得更实惠
AI 正在变得越来越便宜,但战略性部署仍然是关键。LLM 链各个层面的改进带来了显著的成本降低。LLM 提供商之间以及开源竞争对手之间的激烈竞争导致价格不断下降。
同时,训练后软件技术正在提高 LLM 的效率。
来自 Groq 的 LPU 等新硬件供应商的竞争以及传统 GPU 提供商英伟达的改进,正在大幅降低推理成本,使 AI 能够应用于更多用例。
真正的突破来自优化模型在应用程序中的使用方式,即推理时间,而不是训练时间,即模型首次使用数据构建的时间。模型蒸馏等其他技术以及硬件创新意味着公司可以用更少的资源实现更多目标。现在不再是您是否负担得起 AI 的问题——今年,您完成大多数项目的成本远低于六个月前——而是您如何扩展它。
要点:对您的 AI 项目进行成本效益分析。比较硬件选项,探索模型蒸馏等技术,在不影响性能的情况下降低成本。
4. 个性化:记忆赋能 AI
个性化不再是可选的,而是必须的。在 2025 年,支持记忆的 AI 系统正在将这一愿景变为现实。通过记住用户的偏好和过去的互动,AI 可以提供更个性化、更有效的体验。
记忆个性化并没有得到广泛或公开的讨论,因为用户通常对 AI 应用程序存储个人信息以增强服务感到不安。存在隐私问题,以及当模型吐出显示它了解您很多信息(例如,您有多少孩子、您做什么工作以及您的个人喜好)的答案时,会让人感到不舒服。例如,OpenAI 在其系统内存中保护有关 ChatGPT 用户的信息——可以关闭和删除,尽管默认情况下是开启的。
虽然使用 OpenAI 和其他执行此操作的模型的企业无法获得相同的信息,但他们可以利用 RAG 创建自己的记忆系统,确保数据既安全又有效。但是,企业必须谨慎行事,在个性化和隐私之间取得平衡。
要点:制定明确的记忆个性化策略。选择加入系统和透明的政策可以建立信任,同时提供价值。
5. 推理:AI 与现实世界的交汇点
推理是 AI 与现实世界交汇的地方。在 2025 年,重点是使这个过程更快、更便宜、更强大。思维链推理——模型将任务分解为逻辑步骤——正在彻底改变企业解决复杂问题的方式。现在,AI 可以有效地处理需要更深入推理的任务,例如战略规划。
例如,OpenAI 的 o3-mini 模型预计将在本月晚些时候发布,完整的 o3 模型将在稍后发布。它们引入了先进的推理能力,可以将复杂问题分解成可管理的块,从而减少 AI 幻觉并提高决策准确性。这些推理改进适用于数学、编码和科学应用等领域,在这些领域,增加思考可以提供帮助——尽管在其他领域,例如语言合成,改进可能有限。
但是,这些改进也会带来更高的计算需求,从而导致更高的运营成本。o3-mini 旨在提供一种折衷方案,以控制成本,同时保持高性能。
要点:确定可以从高级推理技术中受益的工作流程。实施您公司自己的特殊思维链推理步骤,并选择优化的模型,可以使您在这一领域获得优势。
2025 年的 AI 不仅仅是采用新工具,而是做出战略性选择。无论是部署代理、完善评估还是进行成本效益扩展,成功的道路在于周到的实施。企业应该以清晰、专注的战略拥抱这些趋势。
有关这些趋势的更多详细信息,请查看 Sam Witteveen 和我之间的完整视频播客: