订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
如果说 2023 年是生成式人工智能驱动的聊天机器人和搜索的时代,那么 2024 年就是人工智能代理的时代。从今年早些时候的 Devin 开始,人工智能代理已经发展成为一种现象,为企业和个人提供了一种变革工作方式的方法,从编程和开发到个人任务,例如规划和预订假期。
在这些广泛的应用中,我们还看到了今年数据代理的兴起——人工智能驱动的代理,它们处理跨数据基础设施堆栈的不同类型任务。一些代理执行基本的数据集成工作,而另一些代理则处理下游任务,例如管道中的分析和管理,使企业用户的工作更简单、更轻松。
这些优势包括提高效率和节省成本,这使得许多人不禁要问:未来几年数据团队将如何改变?
虽然代理功能已经存在一段时间了,允许企业自动化某些基本任务,但生成式人工智能的兴起将事情提升到了一个全新的水平。
凭借生成式人工智能的自然语言处理和工具使用能力,代理可以超越简单的推理和回答,实际上可以规划多步骤操作,独立地与数字系统交互以完成操作,同时与其他代理和人员协作。它们还学习随着时间的推移改进其性能。
Cognition AI 的 Devin 是第一个主要的代理产品,它能够大规模地进行工程操作。然后,更大的玩家开始提供由其模型驱动的更具针对性的企业和个人代理。
在今年早些时候与 VentureBeat 的对话中,谷歌云的 Gerrit Kazmaier 表示,他从客户那里了解到,他们的数据从业人员不断面临挑战,包括为数据团队自动化手动工作、缩短数据管道和分析的周期时间以及简化数据管理。本质上,这些团队并不缺乏如何从数据中创造价值的想法,但他们缺乏执行这些想法的时间。
为了解决这个问题,Kazmaier 解释说,谷歌使用 Gemini AI 改进了其核心数据基础设施产品 BigQuery。由此产生的代理功能不仅为企业提供了发现、清理和准备数据以供下游应用程序使用——打破数据孤岛并确保质量和一致性——而且还支持管道管理和分析,使团队能够专注于更高价值的任务。
如今,许多企业都在 BigQuery 中使用 Gemini 的代理功能,包括金融科技公司 Julo,该公司利用 Gemini 理解复杂数据结构的能力来自动化其查询生成过程。日本 IT 公司 Unerry 也在 BigQuery 中使用 Gemini SQL 生成功能,帮助其数据团队更快地提供洞察。
但是,发现、准备和协助分析仅仅是开始。随着底层模型的不断发展,即使是细粒度的数据操作——由专门从事各自领域的初创公司开创——也成为了更深层次的代理驱动自动化的目标。
例如,AirByte 和 Fastn 在数据集成领域成为头条新闻。前者推出了一款助手,可以在几秒钟内从 API 文档链接中创建数据连接器。与此同时,后者通过代理增强了其更广泛的应用程序开发产品,这些代理使用自然语言描述生成企业级 API——无论是用于读取还是写入任何主题的信息。
总部位于旧金山的 Altimate AI 则针对不同的数据操作,包括文档、测试和转换,推出了新的 DataMates 技术,该技术使用代理人工智能从整个数据堆栈中提取上下文。其他一些初创公司,包括 Redbird 和 RapidCanvas,也在朝着相同的方向努力,声称提供可以处理人工智能和分析管道中 90% 数据任务的 AI 代理。
除了广泛的数据操作之外,代理功能还在检索增强生成 (RAG) 和下游工作流自动化等领域得到探索。例如,向量数据库 Weaviate 背后的团队最近讨论了代理 RAG 的概念,这是一个允许 AI 代理访问各种工具——例如网络搜索、计算器或软件 API(如 Slack/Gmail/CRM)——从多个来源检索和验证数据以提高答案准确性的过程。
此外,在今年年底,Snowflake Intelligence 出现了,它为企业提供了设置数据代理的选项,这些代理不仅可以利用存储在其 Snowflake 实例中的商业智能数据,还可以利用跨孤立第三方工具的结构化和非结构化数据——例如数据库中的销售交易、SharePoint 等知识库中的文档以及 Slack、Salesforce 和 Google Workspace 等生产力工具中的信息。
有了这些额外的上下文,代理可以根据自然语言问题提供相关的见解,并针对生成的见解采取具体的操作。例如,用户可以要求其数据代理将出现的见解输入可编辑的表单,并将文件上传到其 Google Drive。他们甚至可以被提示写入 Snowflake 表格并根据需要进行数据修改。
虽然我们可能没有涵盖今年出现或宣布的所有数据代理应用程序,但有一点非常清楚:这项技术将继续存在。随着生成式人工智能模型的不断发展,人工智能代理的采用将全速前进,大多数组织,无论其行业或规模如何,都将选择将重复性任务委托给专门的代理。这将直接转化为效率。
作为这一趋势的证据,在凯捷最近对 1100 位科技高管进行的一项调查中,82% 的受访者表示,他们打算在未来 3 年内在其堆栈中集成基于人工智能的代理——高于目前的 10%。更重要的是,多达 70% 到 75% 的受访者表示,他们会信任人工智能代理来代表他们分析和综合数据,以及处理生成和迭代改进代码等任务。
这种由代理驱动的转变也将意味着数据团队运作方式的重大变化。目前,代理的结果不是生产级的,这意味着人类必须在某个时刻接管,以根据自己的需求微调工作。然而,随着未来几年的一些进步,这种差距很可能会消失——为团队提供更快、更准确且不易出现人类通常会犯的错误的人工智能代理。
因此,总而言之,我们今天看到的数据科学家和分析师的角色可能会发生变化,用户可能会转向人工智能监督领域(在那里他们可以关注人工智能的行为)或系统难以执行的更高价值任务。