人工智能的下一个飞跃:Claude 3.5 赋能自动化工作流程
Anthropic,一家专注于人工智能研究和安全性的公司,最近发布了一系列新功能,其中包括其旗舰 AI 模型 Claude 3.5 Sonnet 的升级版本和一个全新的模型 Claude 3.5 Haiku。这些新功能有望彻底改变企业自动化复杂工作流程的方式。然而,最引人注目的发展是 Claude 的一项新功能:它现在可以像人类一样使用计算机,在屏幕上导航、点击按钮和输入文本。
这项名为“计算机使用”的新功能,将对那些依赖于涉及多个应用程序和标签的重复性任务的行业产生深远的影响。从数据输入到研究再到客户服务,其潜在应用范围广泛,并可能改变行业格局。
AI 从文本交互迈向屏幕交互
自成立以来,Anthropic 一直致力于创建安全、可靠且能够进行复杂推理的 AI 模型。凭借 Claude 3.5 Sonnet 和 Haiku,该公司正在进一步扩展模型的功能。新的“计算机使用”功能使 AI 能够执行以前只能由人工完成的任务,例如打开应用程序、与界面交互和填写表格。
“计算机使用功能有可能改变需要跨多个应用程序导航的任务的执行方式,”Anthropic 首席产品官迈克·克里格在接受 VentureBeat 独家采访时表示。“这将带来更具创新性的产品体验和简化的后台流程。”克里格强调,这项新功能仍处于测试阶段,但随着技术的不断发展,它可以改进数据分析、可视化和用户界面交互,从而提高许多任务的效率。
“我们预计它在进行在线研究、执行重复性流程(如测试新软件)和自动化复杂的多步骤任务方面特别有用,”他说。“随着技术的成熟,它可以增强数据分析、可视化和用户界面交互,从而有可能提高可访问性……我们很高兴看到开发人员将如何利用这项功能来创建新的工具和工作流程,从而提高各个领域的生产力和用户体验。”
Anthropic 最新的 AI 模型 Claude 3.5 Sonnet 通过从 CRM 系统中检索所需信息来自动完成供应商请求表单,展示了其跨不同软件平台执行多步骤任务的能力。(来源:Anthropic)
Anthropic 的早期合作伙伴,包括 GitLab、Canva 和 Replit,已经从 Claude 3.5 Sonnet 的新功能中获益。GitLab 专注于软件开发和安全,一直在测试该模型以自动化其开发流程中的任务。该公司表示,Claude 的推理能力提高了 10%,而性能没有下降,使其非常适合复杂的多步骤流程,例如软件测试和部署。
编码平台 Replit 则更进一步。Replit 总裁米歇尔·卡塔斯塔表示,该模型“为创建强大的自主验证器打开了大门,该验证器可以在应用程序构建过程中对其进行评估。”这可以缓解软件开发中的瓶颈,因为测试通常会延迟项目时间表。
与此同时,图形设计平台 Canva 正在探索 Claude 的计算机使用技能如何加速设计创建和编辑。Canva 人工智能产品负责人丹尼·吴在一份声明中表示:“我们正在团队内部发现效率,这可能会对我们的用户产生重大影响。”
这项新功能与传统自动化工具的不同之处在于,Claude 不局限于特定的工作流程或软件程序。相反,它可以通过屏幕截图“看到”屏幕,与各种应用程序交互,并根据出现的不同任务进行调整。这种灵活性使其比当前的机器人流程自动化 (RPA) 技术更加通用。
例如,在 Anthropic 分享的一个演示中,Claude 帮助完成了 Ant Equipment Co. 的供应商请求表单。在视频中,Claude 首先截取了计算机屏幕的截图,识别出电子表格中缺少一些必要的信息,然后导航到 CRM 系统,找到所需数据,并填写表单——所有这些都无需人工干预。
这种级别的自动化对金融、法律服务和客户支持等行业可能产生重大影响,因为这些行业的任务通常涉及在多个系统和应用程序之间切换。“Claude 可以打开电子表格、运行分析并创建可视化。对于客户服务,它可以导航 CRM 系统以快速查找和更新客户信息,”克里格告诉 VentureBeat。
然而,AI 控制计算机的能力引发了严重的安全性问题和隐私问题。Anthropic 在系统中构建了多项安全措施来解决这些风险。该公司明确表示,Claude 无法在没有开发人员提供必要工具的情况下访问计算机。
“Claude 无法‘随意使用您的计算机’。计算机使用功能需要开发人员提供工具,例如截图工具和操作执行层,这使 Claude 能够执行鼠标移动和按键操作,”克里格解释道。
Anthropic 还通过仅通过 API 提供有限的公开测试版来谨慎地发布该功能。这使开发人员可以在该功能更广泛地可用之前,在受控环境中对其进行测试。该公司还开发了分类器来检测滥用行为,并防止 AI 与敏感网站(例如政府门户网站)交互。“我们用于扫描禁止活动的方法旨在保护客户数据隐私和机密性,”克里格说。
在短期内,企业可能会在数据输入、客户服务和 IT 支持等领域看到立竿见影的生产力提升。但随着技术的成熟,潜在的应用可能会远远超出这些最初的用例。
想象一下,AI 处理复杂法律流程的世界,从审查合同到完成合规表格。或者想象一下,AI 帮助医生浏览电子健康记录并通过交叉引用医疗数据库来诊断患者。
Claude 的新“计算机使用”功能使我们更接近一个 AI 可以执行跨越不同软件应用程序和系统的广泛任务的未来。这赋予了它以前无法想象的灵活性,因为 AI 技术通常局限于特定、狭窄的任务。
不过,重要的是要记住,这项功能仍处于早期阶段。Claude 使用计算机的能力尚不完美,Anthropic 承认它在人类认为微不足道的任务(例如滚动或缩放)方面存在困难。“由于它仍处于测试阶段,并且偶尔会错过短暂的操作,我们建议在高风险任务中进行人工监督,”克里格说。
尽管如此,Anthropic 致力于改进这项技术。“我们开发了新的分类器和提示分析工具来识别潜在的计算机使用功能滥用,”克里格补充道,这表明该公司认真对待解决与这项强大技术相关的风险。
随着 AI 的不断发展,我们的工作方式可能会发生巨大变化。对于企业决策者来说,自动化多步骤工作流程的好处可能是巨大的。但这也会引发关于依赖这些任务的未来工作岗位的问题。
目前,Anthropic 专注于 Claude 3.5 Sonnet 和 Haiku 的直接益处,同时确保负责任地部署这项技术。正如克里格所说:“我们很高兴看到开发人员将如何利用这项功能来创建新的工具和工作流程,从而提高各个领域的生产力和用户体验。”
随着 GitLab、Canva 和 Replit 等公司已经开始探索其潜力,很明显,AI 有望在未来工作中发挥更大的作用——也许比我们想象的还要快。