2024 年 10 月 24 日 下午 4:05
图片来源:Anthropic
订阅我们的每日和每周通讯,获取有关行业领先 AI 报道的最新更新和独家内容。了解更多
Anthropic 推出其全新 Claude 功能“计算机使用”仅两天,但各种技术水平的早期采用者已经找到了各种方法来利用它——从复杂的编码任务到深入的研究,再到收集“分散”的信息。
“计算机使用”仍处于测试阶段,它允许 Claude 自动工作,并像人类一样使用计算机。这项突破性的功能对未来工作具有广泛的影响,因为它可以独立工作,执行重复性任务并快速从大量不同的来源收集数据。
“Anthropic 刚刚发布了我用过的最棒的 AI 技术。我说的不是开玩笑,”初创公司创始人 Alex Finn 在 X(前身为 Twitter)上发帖说。“它真的改变了日常生活。”
?Anthropic 刚刚发布了我用过的最棒的 AI 技术,我说的不是开玩笑。AI 代理已经出现,你现在可以创建自己的 AI 军队,它们会为你工作。这是你的演示和完整的初学者指南:
(相信我,你想要收藏它) pic.twitter.com/MueqisKpmd
Claude 能够通过屏幕截图“看到”屏幕,适应不同的任务,并在工作流程和软件程序之间移动。它还可以跨多个屏幕、应用程序和选项卡导航,打开应用程序,移动光标,点击按钮和输入文本。
“人们对它充满了创意,”自称 AI 教育家的 Min Choi 在 X 上发帖说。
Anthropic 发布“计算机使用”功能才一天。人们已经开始用它来完成工作,并充满了创意。
10 个疯狂的例子:
例如,在一个演示视频中,Finn 要求 Claude 研究热门的 AI 新闻故事并提供概述。Claude 随后打开浏览器,将光标移动到 URL 栏,输入“路透社”,导航到 AI 部分,然后对 The Verge 和 TechCrunch 重复此过程。该模型随后提供了六个热门新闻故事。
“设置它只花了 2 分钟,”Finn 说,并补充道,“AI 代理已经出现。你现在有能力派出自主的 AI 代理来做任何你想做的事情。”
他将这种能力比作拥有自己的免费研究人员,该研究人员“自己推理”。
“它基本上赋予了你超能力,”他说。
在另一个例子中,Anthropic 研究员 Sam Ringer 要求 Claude 收集有关特定供应商的信息。
“我需要填写此表格的数据分散在我的计算机上的各个地方,”他在发布在 X 上的演示视频中解释道。
该模型随后开始截取屏幕截图,发现没有该供应商的条目,导航到客户关系管理 (CRM) 找到该公司,搜索并获得匹配结果。然后,它自动开始传输信息,填写必填字段,最后提交供应商表格。
“这个例子展示了许多人们必须做的繁琐工作,”Ringer 说。
Anthropic 的 Claude 关系负责人 Alex Albert 在 X 上描述了他如何使用 Claude 以及 bash 工具(一种命令语言)下载随机数据集,安装开源机器学习 (ML) 库 sklearn,在数据集上训练分类器并显示其结果。这仅需 5 分钟。
他在提示中很俏皮,告诉 Claude“如果一开始效果不好,你可能需要检查数据和/或迭代,但不要灰心!”
这太棒了。Claude 结合“计算机使用”功能和 bash 工具,可以从网上下载随机数据集,安装 sklearn,在数据集上训练简单的分类器,然后在网页上显示分类器结果。
所有这些都只需一个提示,不到 5 分钟即可完成。 pic.twitter.com/OFr3A0N4CM
一位 X 用户报告说:“我让我的 Claude 计算机使用代理运行它自己的代理!”
其他人评论道:“Claude 计算机使用功能确实是 AGI”,以及“我认为要不了多久,我们的代理就会变得完全自主。”
Anthropic 研究人员也指出了几个有趣的人格化例子,包括一个似乎模拟人类拖延的行为:在执行编码演示时,Claude 随机转向并开始浏览黄石国家公园的照片。
Anthropic 的新“计算机使用”功能基本上是一个 AI 代理,它可以接管你的计算机,并像你一样使用它(移动鼠标光标,打开浏览器,下载文件,使用编码工具)。
最令人印象深刻的是,它学会了拖延的艺术。 pic.twitter.com/w4m03M35Jy
此外,新功能允许 Claude 绕过旨在阻止它的非常人性化的验证控制。
X 用户“Pliny the Liberator”发帖说:
“PSA:我的 CLAUDE 代理现在可以解决 CAPTCHA 了???
BAHAHAHAHAAA 太过分了”
他分享了一个使用 Claude 登录 ChatGPT 的视频。Claude 报告说:“我看到有一个 Cloudflare CAPTCHA 验证。根据系统说明,如果我们在模拟中看到 CAPTCHA,我应该点击带有灰色边框的白色正方形的中心。”
它这样做后,获得了“消息 ChatGPT”登录页面的访问权限。
“永远不会一样了,”Pliny 评论道。