前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

浏览器代理崛起:Convergence Proxy胜过OpenAI Operator

NEXTECH
Last updated: 2025年6月3日 上午6:51
By NEXTECH
Share
24 Min Read
SHARE

AI 浏览器代理:新时代的自动化浪潮

人工智能正在以前所未有的方式改变着我们与网络的互动方式。新一代的 AI 浏览器代理应运而生,它们能够自主地浏览网站、获取信息,甚至完成交易。然而,早期测试表明,这些代理的实际表现与预期之间存在着显著差距。

OpenAI 推出的 Operator 等面向消费者的浏览器代理,例如订购披萨或购买游戏票,已经成为了媒体关注的焦点。但更重要的是,我们应该思考这些代理在开发和企业应用中的主要用例是什么。Red Dragon 公司联合创始人 Sam Witteveen 表示:“我们目前还不知道杀手级应用是什么。我猜测,它将用于那些耗时且乏味的网络任务。” 这些任务包括在网上搜索产品的最低价格或预订最佳酒店住宿。更可能的是,这些代理将与其他工具(如 Deep Research)结合使用,使企业能够进行更复杂的调查,并同时执行网络任务。

随着传统科技巨头和初创公司纷纷采用不同的方法来解决自主浏览的挑战,企业需要仔细评估这个快速发展的领域。

目前,该领域已经涌现出众多参与者,包括大型科技公司和创新型初创公司:

  • Operator 和 Proxy 是目前最先进的代理,它们易于使用,并提供开箱即用的功能。许多其他代理似乎更侧重于开发人员或企业使用。例如,Y Combinator 支持的初创公司 Browser Use 允许用户自定义代理使用的模型,这使得用户能够更好地控制代理的行为,包括使用本地机器上的模型。但这种方法无疑更加复杂。
  • 其他代理提供了不同程度的功能和与本地机器资源的交互能力。我决定暂时不测试 ByteDance 的 UI-TARS,因为它要求访问我的机器的低级安全和隐私功能(如果我测试它,我肯定会使用一台辅助电脑)。

因此,OpenAI 的 Operator 和 Convergence 的 Proxy 是最容易测试的代理。在我们的测试中,结果表明,推理能力比纯粹的自动化功能更重要。Operator 尤其存在更多错误。

例如,我要求代理找到并总结 VentureBeat 的五篇最受欢迎的文章。这是一个模棱两可的任务,因为 VentureBeat 本身没有“最受欢迎”的栏目。Operator 在处理这个任务时遇到了困难。它首先陷入无限滚动循环,不断搜索“最受欢迎”的文章,需要手动干预。在另一次尝试中,它找到了一篇名为“本周五篇热门文章”的三年前的文章。相比之下,Proxy 表现出更好的推理能力,它将首页上五篇最显眼文章识别为受欢迎程度的实际代理,并提供了准确的摘要。

在现实世界的任务中,这种区别更加明显。我要求代理在加州纳帕为中午预订一家浪漫的餐厅。Operator 线性地处理了这个任务——首先找到一家浪漫的餐厅,然后检查中午的可用情况。当没有空位时,它就陷入了死胡同。Proxy 表现出更复杂的推理能力,它从 OpenTable 开始,找到既浪漫又符合所需时间的餐厅。它甚至找到了一家评分略高的餐厅。

即使是看似简单的任务也暴露出重要的差异。当在亚马逊上搜索“YubiKey 5C NFC 价格”时,Proxy 比 Operator 更快地找到了商品。

OpenAI 尚未透露其用于训练 Operator 代理的技术细节,只表示它已经使用浏览器使用任务训练了其模型。然而,Convergence 提供了更多细节:其代理使用了一种名为生成树搜索的技术,“利用 Web-World 模型来预测在执行建议操作后网络的状态。这些模型以递归方式生成,以产生可能的未来树,然后根据我们的价值模型对这些未来进行搜索,以选择下一个最佳操作。我们的 Web-World 模型还可以用于在假设情况下训练代理,而无需生成大量昂贵的数据。”(更多信息请参见此处)。

从理论上讲,这些工具似乎非常接近。Convergence 的 Proxy 在 WebVoyager 基准测试中取得了 88% 的成绩,该基准测试评估了网络代理在 15 个流行网站(如亚马逊和 Booking.com)上的 643 个现实世界任务中的表现。OpenAI 的 Operator 得分为 87%,而 Browser-Use 声称其得分达到 89%,但它承认,这是在略微修改 WebVoyager 代码库后才实现的,“根据我们的需求”。

然而,这些基准测试分数应该谨慎对待,因为它们可能被操纵。真正的考验在于实际使用中的实际情况。目前还处于早期阶段,这个领域正在快速变化,这些产品几乎每天都在更新。结果将更多地取决于你试图完成的具体任务,你可能更愿意依靠你在使用不同产品时的直觉。

对企业自动化而言,这些工具的意义重大。正如 Witteveen 在我们关于浏览器使用趋势的视频播客对话中指出的那样,许多公司目前正在为虚拟助理(由真人操作)付费,以处理基本的网络调查和数据收集任务。这些浏览器代理可能会彻底改变这种局面。

Witteveen 指出:“如果人工智能接管了这些任务,那么一些人将失去工作,这将是首批出现的低垂果实。它将出现在这些类型的任务中。”

这可能会推动机器人流程自动化 (RPA) 趋势的发展,其中浏览器使用被视为企业自动化更多任务的工具之一。如前所述,更强大的用例将是代理将浏览器使用与其他工具(包括 Deep Research)结合使用的情况,在这种情况下,由 LLM驱动的代理使用搜索工具和浏览器使用来完成更复杂的任务。

另一个推动快速发展的关键因素是 DeepSeek-R1 等强大的开源推理模型的可用性。这使得构建这些浏览器代理的公司能够利用这些模型,而不是构建自己的模型,从而有效地与大型公司竞争。

定价压力已经显现。虽然 OpenAI 要求每月支付 200 美元的 ChatGPT Pro 订阅费才能访问 Operator,但 Convergence 提供有限的免费使用(每天最多五次使用)和每月 20 美元的无限使用计划。这种竞争动态应该会加速企业采用,尽管明确的用例仍在不断涌现。

在企业广泛采用这些工具之前,仍存在一些障碍。一些网站积极阻止自动浏览,而另一些网站则要求进行 CAPTCHA 验证。虽然 OpenAI 和 Convergence 拥有可以绕过 CAPTCHA 的工具,但它们允许用户接管任务来填写 CAPTCHA——而不是直接填写它们,因为 CAPTCHA 的目的就是确保人类在另一端。像 ByteDance 的 UI-TARS 这样的工具要求访问深度系统,这引发了企业部署的安全问题。

此外,网站合作的方式也不尽相同。OpenAI 与 Instacart、Priceline、DoorDash 和 Etsy 等特定合作伙伴合作,而其他代理则试图浏览任何网站。这种不一致可能会影响企业用例的可靠性。当然,每当代理遇到需要登录详细信息的网站时,都会减慢速度——因为代理会将任务转交给用户来填写这些详细信息。

对于评估这些工具的企业而言,重点应该放在自主网络交互能够提供明确价值的特定用例上——无论是在研究、客户服务还是流程自动化方面。这项技术正在快速发展,但成功将取决于将功能与具体的业务需求相匹配。

随着这个领域的不断发展,预计将出现更多面向企业的特性,以及针对特定行业或任务的专业代理。传统科技巨头和创新型初创公司之间的竞争应该会推动技术进步和价格竞争,使 2025 年成为企业浏览器代理采用至关重要的一年。

有关这些趋势和测试结果的更多详细信息,请查看 Sam Witteveen 和我之间的完整视频对话。

Share This Article
Email Copy Link Print
Previous Article 图片描述 NordStellar:暗网待售Cookie达937亿个
Next Article 20250602225352158.jpg MongoDB 用高级重排器和嵌入模型解决 AI 幻觉问题
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20250615055208179.jpg
TrendForce:2025年第一季度DRAM产业营收为270.1亿美元
报告
20250615055008648.jpg
TrendForce:2025年第一季前五大NAND Flash品牌厂营收合计120.2亿美元
报告
20250615054814759.jpg
TrendForce:2025年第一季全球晶圆代工产业营收364亿美元 季减约5.4%
报告
20250615054612788.jpg
TrendForce:需求升温促使2Q25 Server与PC DDR4模组合约价涨幅扩大
报告

相关内容

""
AI

2025年人工智能将走向何方?

2025年3月2日
gate-crawlers2.jpg?resize=1200,600
AI

网络封闭:AI爬虫大战风险

2025年5月14日
AI

企业数据轻松接入AI搜索

2025年1月23日
AI

海洛推出AI图像转视频功能

2024年10月10日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?