人工智能代理:未来已来?
人工智能领域正掀起一股“代理”热潮。微软最近发布了一套自主代理,旨在简化客户服务、销售和供应链任务。与此同时,OpenAI 推出了 Swarm,一个用于探索多代理系统之间更好协调的实验框架。而来自 Anthropic 的大型语言模型 (LLM) Claude 则将代理型人工智能提升到了一个新的高度,其计算机使用技能的测试版已经能够实现从移动鼠标光标到点击按钮和使用虚拟键盘输入文本等操作。
那么,人工智能代理究竟是什么呢?
亚马逊云科技 (AWS) 的人工智能驱动的软件开发助手 Amazon Q Developer 产品管理总监 Adnan Ijaz 解释道:“人工智能代理是能够完成任务或做出决策的先进人工智能系统。人类设定目标,而代理则自主地找出最佳行动方案。” 这些代理可以与外部系统交互,在现实世界中采取行动。
除了自主性之外,代理型人工智能还可以接收反馈并不断改进任务,麻省理工学院计算机科学与人工智能实验室助理教授 Yoon Kim 表示。
可以将人工智能代理视为生成式人工智能的更强大版本。虽然两种技术都依赖于 LLM 作为其底层模型,但生成式人工智能根据其训练数据中学习到的模式创建新内容。另一方面,代理系统不仅能够生成内容,还能够根据从其环境中获得的信息采取行动。Ijaz 说:“因此,所有这些本质上都是比生成式人工智能更进一步的步骤。”
人工智能代理的工作原理
为了完成特定任务,人工智能代理通常遵循三部分工作流程。首先,他们通过用户指定的提示确定目标。接下来,他们通过将目标分解成更小、更简单的子任务并收集所需数据来确定如何实现目标。最后,他们利用其知识库中包含的内容以及他们积累的数据来执行任务,利用他们可以调用的任何函数或他们拥有的工具。
以预订航班为例,想象一下一个提示“在 Y 日预订从 A 到 B 的最便宜航班”。人工智能代理可能会首先在网络上搜索 Y 日从 A 到 B 的所有航班,扫描搜索结果,并选择价格最低的航班。然后,代理调用一个连接到航空公司航班预订平台的应用程序编程接口 (API) 的函数。代理为所选航班进行预订,根据其知识库中存储的信息输入用户的详细信息。
Ijaz 说:“代理型交互的关键在于系统能够理解你想要完成的目标,然后自主地对其进行操作。” 然而,人类仍然参与其中,指导流程并在需要时进行干预。例如,航班预订人工智能代理可能会被指示在最便宜的航班没有座位时通知用户,允许用户决定下一步行动。Ijaz 补充说:“如果在任何时候人类认为系统没有朝着正确的方向发展,他们可以覆盖它——他们拥有控制权。”
代理型人工智能的承诺与陷阱
与生成式人工智能一样,代理型人工智能也承诺提高效率和生产力,代理可以执行对普通人来说单调乏味或重复性的任务。
Kim 说:“如果这些系统变得足够可靠,那么我们就可以让代理为你安排日历或代你预订餐厅——做一些你原本需要助手做的事情。”
这里的关键词是“可靠”,数据隐私和安全是代理型人工智能面临的主要挑战。Ijaz 说:“代理正在查看大量数据。他们正在对数据进行推理,他们正在收集数据。重要的是要实施正确的隐私和安全保障措施。”
例如,加州大学圣地亚哥分校和新加坡南洋理工大学的研究人员能够诱使人工智能代理进行不当的工具使用。他们创建了一种恶意提示攻击,该攻击分析用户的聊天会话,提取个人身份信息,并将其格式化为将数据泄露到攻击者服务器的命令。该攻击对 Mistral AI 的 Le Chat 对话式助手有效,因此研究人员向该公司披露了安全漏洞,导致产品修复。
事实准确性是人工智能代理面临的另一个问题,因为它们是基于 LLM 构建的,而 LLM 存在幻觉问题——这是对编造内容的技术术语。Kim 指出,虽然让人工智能代理提供有关航班的错误信息肯定是不希望的,但这种错误可能不会造成灾难性的后果。Kim 说:“这不像在临床或金融环境中使用这些类型的系统那样风险高,在这些环境中,输出或操作的准确性或缺乏准确性可能会产生严重后果。”
代理型人工智能仍处于起步阶段,随着人工智能代理的不断发展,它们有望让人们的生活更轻松、更高效。但对于它们带来的风险,仍然需要谨慎。Ijaz 说:“这是一项重要的进步,我认为它所获得的所有关注都是合理的。代理是人类武器库中的另一种工具,只要我们以遵循负责任的人工智能实践的方式构建这些代理,人类就会将这些工具用于好的用途。”