在谷歌Gemini 3.0尚未正式亮相之际,OpenAI和Anthropic却在同一天接连发布了各自的新产品。
今天凌晨,OpenAI发布了一款以ChatGPT为核心打造的全新浏览器「ChatGPT Atlas」。ChatGPT Atlas的三大核心功能都十分实用:
-
内置AI助手:可通过侧边栏在任意页面调用。在任意网页上点击右上角的“Ask ChatGPT”,旁边就会弹出侧边栏,AI能够直接看到页面内容并提供解答,无需再进行截图或复制粘贴;
-
浏览器记忆:可搜索浏览记录。浏览器会记住用户的浏览历史,之后可以直接用自然语言提问,例如「帮我找出上周看过的所有招聘信息」。此功能为可选设置,用户可在隐私设置中随时关闭或删除记录;
-
AI智能体:可在页面上执行操作。AI能够像人类一样操作浏览器,自动点击、输入、跳转页面。不过目前此功能仅开放给付费用户;
简而言之,ChatGPT Atlas旨在将ChatGPT深度集成到浏览器操作中,使其成为用户的智能助手。

随后,Anthropic紧随其后,也正式发布了其Claude Desktop桌面端(此前为预览版),主打「随时随地召唤Claude」。Mac版的新功能尤其便捷:
-
全局快捷键:双击Option键即可在任何界面唤醒Claude,在编写代码、查阅文档时随叫随到;
-
屏幕共享:可以直接截图或共享整个应用窗口给Claude,省去反复拖拽文件的麻烦;
-
语音输入:按下Caps Lock键即可通过语音与Claude交流(但需注意避免与输入法切换冲突);
-
工具连接:通过MCP协议连接代码编辑器、本地文件等,让Claude直接操作你的工作环境;
两大巨头的产品理念各有侧重:OpenAI致力于将AI深度集成至浏览器网页操作,而Anthropic则专注于提供一个能在电脑全局随时待命的AI助手。
面对这一竞争态势,浏览器市场巨头谷歌将如何应对,令人拭目以待。
ChatGPT Atlas:上手体验与智能体模式付费情况
ChatGPT Atlas的上手非常简单:首次打开时,只需登录你的ChatGPT账户,并从当前浏览器导入书签、已保存的密码和浏览历史即可。
顺便一提,设为默认浏览器后还可获赠7天「会员」。

目前,全球macOS用户均可下载使用ChatGPT Atlas,包括免费、Plus、Pro及Go用户。Windows、iOS和Android版本将很快推出。
与此同时,Beta版已提供给Business用户;开启相关权限后,Enterprise和Edu用户也能使用。
而最为关键的「智能体模式」,则会以预览版的形式向Plus、Pro和Business用户开放(仅限付费用户)。
看来,又有一波初创企业将面临巨大挑战。

AI智能体深度集成:Atlas接管浏览器操作
有了Atlas,ChatGPT可以在网络的任何角落与你同行:
它能在当前所在的窗口中,直接提供帮助,理解你的意图,并协助你完成任务,全程无需复制粘贴或离开当前页面。
由于Atlas内置ChatGPT记忆功能,因此对话可以随时调用过往的聊天记录和细节,助你高效完成新任务。
使用Atlas越多,ChatGPT就会变得越智能、越得力。
浏览器记忆功能让ChatGPT能够记住你访问过网站的上下文,并在你需要时随时调用。
这意味着你可以向ChatGPT提问,例如:「找出我上周浏览过的所有职位招聘,并总结一下行业趋势,帮我为面试做准备。」
同时,浏览器中的记忆也完全由你掌控:在设置中,你可以随时查看或归档记忆,删除浏览历史也会一并删除所有相关的浏览器记忆。

通过智能体模式,ChatGPT还可以在Atlas中为你分担工作。
经过改进,它能更好地结合你的浏览上下文,运行速度更快、用途更广,如今更擅长研究分析、任务自动化,并能在你浏览网页的同时,帮你规划活动或预订约会。

当智能体控制浏览器时,光标的方向和我们常用的正好相反。
对此,有网友在试用之后进行了总结:
-
智能体模式能够协助完成多项任务,例如在浏览器中使用保存的密码预订咖啡、填写TSA预检申请表。
-
当智能体所在的标签页处于后台时,可能会受到内容拦截器的干扰。
-
部分网站会阻止Atlas总结内容。
-
智能体操作起来非常接近真人行为,例如它会通过点击弹窗旁边的空白区域来关闭弹窗。
-
用户界面设计优秀,新手引导流程顺畅。它巧妙地利用了Mac的全屏空间,动画效果令人印象深刻。
顺便一提,Atlas依然是基于谷歌的Chromium内核打造。

工作流无缝衔接
新标签页是你在Atlas中的起点。无论是提问还是输入网址,都能在同一个地方获得更快、更有用的结果。
如果想探索聊天以外的特定结果类型,可以切换至搜索链接、图片、视频和新闻等标签页。
打开一个标签页
接下来,无论你打开什么网页,点击「询问ChatGPT」即可打开ChatGPT侧边栏,无需离开当前窗口,就能进行内容总结、概念解释或处理各项任务。
ChatGPT能够理解您当前浏览的页面详情,因此它的回复会更贴切、更有帮助。

询问ChatGPT
当你在任意文本框中书写时,ChatGPT也能随时提供帮助,给出实时的编辑和修改建议。
使用光标
为你量身打造
ChatGPT能记住你探索过的内容,并为你建议下一步行动,无论是返回最近访问的页面、深入研究某个主题、发现相关灵感,还是将日常任务自动化。
个性化建议
当你有需要时,只需开口即可。
输入「重新打开我昨天看过的那些鞋子」或「整理一下标签页」,剩下的就放心交给ChatGPT吧。

随心所问
更强能力,更强掌控
在你浏览网页时,你所能看到和记住的内容,完全由你掌控。
你可以清除特定页面的记录,清空全部浏览历史,或者打开无痕窗口临时退出ChatGPT登录状态。

如果你开启了浏览器记忆,ChatGPT将会记住你浏览内容的关键细节,从而优化聊天回复并提供更智能的建议。
比如,根据你近期的活动创建待办事项清单,或基于你浏览过的商品继续研究节日礼物。
浏览器记忆属于你的ChatGPT账户隐私,并由你全权控制。
你可以在设置中查看所有记忆,归档不再需要的内容,或通过清除浏览历史来删除它们。
即使开启了浏览器记忆,你也可以随时通过地址栏的开关决定ChatGPT是否可以查看某个特定网站。
当页面可见性关闭时,ChatGPT将无法查看该页面内容,也不会从中创建任何记忆。
默认情况下,OpenAI不会使用你浏览的内容来训练模型,但你也可以选择开启。
家长控制功能同样适用,并且还添加了如关闭浏览器记忆和智能体模式等新的选项。
让AI帮你做事
在Atlas中,你现在可以直接让ChatGPT采取行动,就在你的浏览器里为你完成各种任务。
此前OpenAI推出的ChatGPT智能体,现已正式原生集成于Atlas中,并且运行速度更快。
想象一下,你正计划一场晚宴,心中已有一份食谱。你可以把食谱交给ChatGPT,让它帮你找到一家生鲜商店,将所有食材加入购物车,并下单送到你家。
在工作中,你可以让ChatGPT打开并阅读过去的团队文档,执行新的竞品调研,并将洞察汇总成一份团队简报。
当你提出请求时,ChatGPT可能会询问是否可以打开标签页并执行点击操作来完成任务。你也可以直接选择智能体模式按钮,让ChatGPT开始行动。

在构建Atlas中ChatGPT的智能体能力时,OpenAI增加了多重保障措施以应对新出现的风险,例如:
-
它无法在浏览器中运行代码、下载文件或安装扩展程序。
-
它无法访问你计算机上的其他应用程序或文件系统。
-
在金融机构等特定敏感网站上执行操作时,它会暂停,以确保你在监督其行为。
-
你可以在登出模式下使用智能体,以限制其对敏感数据的访问,并降低它以你的身份在网站上执行操作的风险。
ChatGPT的智能体能力依然存在风险。除了在代表你行动时可能犯错外,智能体还易受隐藏恶意指令的操纵。
这些指令可能被藏匿在网页或电子邮件等地方,意图覆盖ChatGPT智能体的正常行为,可能导致从你已登录的网站窃取数据,或执行你非预期的操作。
总的来说,此次发布标志着我们正迈向一个全新的未来:
在这里,大部分网络活动都将通过智能体系统完成,你可以把常规工作都交给它处理,从而专注于真正重要的事情。
氛围编程(vibe coding)是AI辅助的起点,而OpenAI想通过ChatGPT Atlas让所有人都能过上氛围生活(vibe lifing),享受AI伙伴随时介入带来的高效生活。

OpenAI表示,Atlas浏览器还在持续进化中,后续产品路线图中将包括:
-
支持多用户配置文件,满足不同使用场景;
-
提升开发者工具体验;
-
为使用Apps SDK的开发者提供更多方法,提升他们应用在Atlas中的可发现性。
ChatGPT Atlas研发团队:Chrome核心开发者加盟
首先登场介绍的是,Atlas项目工程负责人Ben Goodger,Atlas项目产品负责人Adam Fry,以及Atlas项目首席设计师Ryan O’Rouke。

随后做介绍的是,Atlas项目产品负责人Pranav Vishnu,Atlas团队工程师Justin Rushing,以及Agent功能研发负责人Will Ellsworth。

Ben Goodger是本场直播出席人员中最值得介绍的一位。
他是一位浏览器专家,从上世纪开始就专注于浏览器开发工作。
从网景到火狐,再自2005年起加入谷歌开发Chrome,他是除了当时的领导、也是如今的CEO劈柴哥之外,对Chrome开发贡献最大的人员之一。
2024年,他以谷歌副总裁的身份离开谷歌转投OpenAI,全权负责ChatGPT Atlas的技术开发工作。

而如今ChatGPT Atlas经过一年半的孕育终于发布,他难掩喜悦,招聘广告也接踵而至。
AI浏览器市场竞争:各巨头纷纷入局
在OpenAI DevDay大会上,ChatGPT负责人Nick Turley接受媒体采访时表示,他的灵感来自「浏览器正在重新定义操作系统的样子」。
他指出,浏览器已经彻底改变了人们在线工作的方式,而ChatGPT也正在引发类似的变革。
早在2024年7月,OpenAI就低调发布过一款原型搜索引擎,名为SearchGPT。
到了现在,AI浏览器已经成为AI技术角逐的新前线。
今年夏季,AI新锐公司Perplexity推出自家浏览器产品Comet,一度引发热议。
它主打「简化上网体验」,摒弃传统的谷歌搜索结果「长截图」,转而提供一个「答案引擎」:先给出几条相关链接,再直接用AI回答用户问题。
不仅如此,它还能:
-
扫描所有打开的网页标签;
-
总结视频内容;
-
清理邮件收件箱;
-
甚至能在Amazon上代用户购物。

9月,谷歌宣布将把自家的Gemini AI助手更深度集成进Chrome浏览器。
未来几个月,Gemini将在Chrome中升级各种功能:

不过,谷歌目前尚未透露确切的上线时间。
随着OpenAI的Atlas正式登场,AI浏览器之战正在升温。
当然,OpenAI能否真正撼动全球超30亿用户的Chrome浏览器,还未可知。
目前来看,AI浏览器在硅谷已成为炙手可热的风口,但它们在大众市场的影响力仍待检验。
