Comet与Dia相继开放:AI浏览器如何解决用户痛点?实用场景与发展挑战解析
随着Comet和Dia等AI浏览器的相继开放并提供免费体验,其在解决用户痛点方面的潜力日益凸显。本文将从以下三个方面深入探讨AI浏览器:
-
AI浏览器的三个实用场景
-
AI浏览器为何诞生?
-
AI浏览器对Chrome的挑战:有,但还不够大
一、AI浏览器的三个实用场景
场景一:批量自动化操作
当用户的X账号有太多机器人关注时,系统可能会将账号判定为低质而封禁。应对这种情况的建议操作之一就是屏蔽机器人粉丝。然而,手动屏蔽大量机器人粉丝效率低下。此时,用户可以利用Comet浏览器打开自己的X个人主页,然后点击Comet右上角的Assistant,在对话框中输入指令“屏蔽我的机器人粉丝”。Comet会进入“关注者”列表,并根据识别机器人粉丝账号的逻辑(通常特征:头像默认、简介空白、无原创内容、名字随机、关注数远大于粉丝数等),依次屏蔽这些账号(如下图)。
同理,Comet还可以帮助用户筛选并关注符合条件的X账号,或批量回复,又或者自动完成报表生成、邮件分发、数据抓取等重复性工作。
用户无需手动操作、编写脚本,也无需调用 MCP 或 RPA,只需通过自然语言描述需求,即可告别繁琐的Prompt撰写。
场景二:创建快捷指令来执行日常任务
除了前面提到的批量自动化操作外,如果用户平常有一些日常任务,比如每天跟踪AI行业大事件、翻译外文博客,或者查看日程安排等,都可以在Comet中创建快捷方式来实现。在对话框输入“/”即可唤起快捷方式菜单,在菜单底部便是【+创建快捷方式】选项;
点击【+创建快捷方式】后,将进入快捷方式配置窗口,其中配置项包括:
- 快捷方式名称:只能包含字母、数字、下划线和连字符,暂不支持中文。
- 指令:即用户期望Comet执行的具体任务,该指令将直接发送至Comet。
- 高级:包括模式(分为搜索、研究和实验室三种)、模型(可选择主流的最强模型)和来源(分为网页、学术、社交和Finance四种)。

配置完成后,用户后续执行该任务时,无需在对话框重复输入大段指令,只需输入快捷指令,即可快速执行这类日常任务(如下图)。


场景三:多标签页对比、关联、整合等
如果用户想要横向比较三家保险公司的产品,传统方法是在浏览器中分别访问三个网站,手动记录和比对各项条款,整个过程耗时耗力;稍新一点的方法,是将这三个网站的链接复制粘贴给常用的AI工具,然后让其整合产品信息并对比。
而现在,用户只需要在Comet中打开这三家产品的产品页,然后在输入框手动@这三个网页,并输入指令即可。
例如,该功能常用于对比提供相似解决方案的GitHub项目(如下图所示,正在对比markitdown、MinerU和marker的区别),极大地提升了用户体验。
除了对比,Comet这类AI浏览器还可以用于关联和整合信息。例如,可以将打开的PDF、表格、文档等不同格式的信息进行整合,生成一份深度报告;还可以在打开的不同信源之间进行交叉对比和角色关联。若在过去创作《网文二十五年》时能有AI浏览器辅助,其创作速度无疑将大幅缩短。
以上只是AI浏览器应用场景的冰山一角,许多过去需要通过各种浏览器插件解决的问题,现在都被融合进AI浏览器中,如同彩蛋般等待用户发现。
Dia创始人Josh Miller和Hursh Agrawal在Every的播客采访中分享过一个用户故事:“用户可能不会立即注意到某些功能,但在使用过程中会逐渐发现。比如今天早上,有用户用Dia已经有几周了。他们会发现一些彩蛋,比如在YouTube上查歌的时候,可以让Dia自动给出吉他和弦,方便弹奏。”
二、AI浏览器为何诞生?在介绍AI浏览器的实用场景时,已经给出了第一个答案:传统浏览器存在较多痛点。
2.1 传统浏览器存在较多痛点
传统浏览器,如Google Chrome、Mozilla Firefox和Apple Safari,其设计哲学根植于一个以文档为中心的互联网时代。
它们的核心功能是作为访问和渲染网页的客户端,整个交互模式主要依赖于用户的主动、精确操作,如点击链接、填写表单和手动搜索。然而,随着网络信息量的爆炸式增长和用户需求的日益复杂化,这种传统模式的局限性愈发凸显,例如:
信息检索和整合困难:在进行一项复杂任务(如撰写研究报告)时,用户可能会打开数十个甚至上百个标签页,包括学术论文、新闻网站、社交媒体等。这种“标签页地狱”使得信息检索和整合异常困难,因为用户需要在众多标签中来回切换以寻找所需内容。

手动操作的低效与重复性:传统浏览器需要用户手动执行绝大多数操作,从简单的信息搜索到复杂的多步骤任务,如数据抓取、内容比较和跨平台信息同步。这种高度依赖人工的模式不仅效率低下,而且充满了重复性劳动。用户无法将精力集中在更高层次的思考和决策上。
这些痛点并非现在才出现,只是之前一直未能有效解决,直到LLM和Agent技术的成熟,为解决这些痛点提供了可能性。
2.2 AI技术成熟带来的机遇
在Every的播客采访中,Josh Miller(Dia创始人之一)坦言,现在有底气做Dia浏览器,正是因为技术开始变得可行。他表示:
“GPT-4o让Dia真正跑了起来。刚做Dia的时候,记得很清楚,还专门联系了OpenAI的朋友说,你们这个新模型让我们产品真的能落地了。”
Dia的发展特别像Cursor,都是一个模型能力的直接提升带来产品能力的迭代。Cursor成立于2022年,最开始也不是做代码编辑器;后面虽然做了代码编辑器,一开始也没火。它真正为大家所知,是2024年7、8月份,因为Claude-3.5-Sonnet发布了。
以GPT-4o等为代表的大语言模型,具备了强大的自然语言理解、推理和生成能力。它们能够理解用户模糊、复杂的自然语言指令,而不仅仅是关键词匹配,然后将这些指令自主地将其分解为一系列可执行的子任务,并调用相应的工具(如浏览器API、外部API)来完成这些任务。
例如,当用户下达“我想阅读有关GUI Agent的论文。请帮我找到十篇相关论文,并将它们整理成一份报告进行概述”的指令时,Fellou浏览器中的Agent就会自动将它分解为在搜索特定论文、筛选符合要求的论文、提取论文信息等多个步骤,并自动执行。这种自主任务规划与执行的能力,使得浏览器能够完成过去需要大量手动操作的复杂工作流。

所以,AI浏览器的诞生是信息时代传统浏览器痛点与AI技术成熟共同作用下的必然结果。
传统浏览器的最终产出是信息,而AI浏览器的最终产出是结果。用户不再满足于仅仅找到信息,而是希望浏览器能够直接帮助他们完成目标。
这种范式的转移,要求浏览器具备更强的主动性、智能性和行动能力。于是便有了AI浏览器的生长空间。
AI浏览器对Chrome的挑战:有,但还不够大
AI浏览器严格来说分为两类:一类是前面提到的Comet、Dia、Fellou,属于AI Native Browser,这种是从设计之初就将AI能力深度嵌入到浏览器的内核中。另一类是在现有浏览器上叠加AI模块来增强能力,以Google Chrome、Microsoft Edge和国内厂商如360AI浏览器、夸克浏览器为代表。在AI Native Browser出现后,许多人将其视为Chrome的有力竞争者。但从StatCounter最新发布的浏览器市场份额数据看,截至2025年9月,Chrome全球桌面浏览器市场份额达73.81%,甚至较8月还提升了3.5个百分点,依然稳居全球主导地位。其他主流浏览器依次为:Edge(10.43%)、Safari(5.73%)、Firefox(4.47%)。
虽然Comet、Dia等AI浏览器吸引不少资本关注和用户尝试。例如Comet在2025年5月月活跃搜索量达7.8亿次,环比增速超20%,但用户主要还是集中在高端订阅市场,整体体量和Chrome仍然不具可比性,甚至对比其它主流浏览器也有较远的距离。
而且Chrome、Edge等传统浏览器自身也在积极集成AI能力,来巩固和扩展市场份额。所以在短时间内,AI Native Browser对Chrome的冲击会有,但不大。
Chrome的统治力还体现在AI搜索上。硅谷知名投资人Nathan Benaich在其发布的《State of AI Report – 2025 ONLINE》中,对AI搜索模块进行了深入分析,其中提到:
尽管ChatGPT、Perplexity等AI搜索正在侵蚀Google的市场份额,但没有任何一方找到替代Google搜索作为高质量网络索引的好方法。OpenAI目前仍然选择抓取Google搜索结果。
Google搜索有着持续统治力。

此举也令人联想到上个月Google搜索策略的一项调整,曾引发行业震荡。
Google悄悄移除了num=100搜索参数。这意味着用户无法再一次性查看100个结果,“长尾”访问被大幅削减。现在默认的最大值是10。
这之所以重要,是因为大多数LLMs(OpenAI、Perplexity等)直接或间接地依赖谷歌索引的结果,以及它们自己的爬虫。
这种调整带来的直接结果就是:
-
根据Search Engine Land的数据,88%的网站出现了曝光量下降。
-
Reddit,通常排名在11至100位,其LLM引用量大幅下降,股价更是下跌了15%。
对于小团队或者独立开发者来说,这意味着AEO(尤其是面向海外的AEO)会变得更难,自己的产品更难被看见。
所以,无论从AI浏览器还是AI搜索的角度,目前Chrome的地位还很难被撼动。
写在最后
用户在初期使用Comet和Dia等AI浏览器时,可能会存在一定程度的不适应。然而,经过一段时间(例如一个月)的实际体验,其带来的诸多便利将逐渐被用户所感知。
然而,许多用户目前默认使用的浏览器仍是Chrome。
对于互联网和移动互联网的早期用户而言,长期形成的Chrome浏览器使用习惯可能导致较高的产品依赖和迁移成本。然而,对AI时代的原住民来说,他们将从一开始就接触并使用AI搜索和AI浏览器,这种代际差异带来的影响将随着时间推移愈发显著。尽管Comet、Dia、Fellou等具体产品未来发展不确定,但AI浏览器作为一种新的交互范式将持续演进。
关于AI浏览器最终形态的探讨尚未有定论,但Dia创始人Josh Miller的以下两段话提供了深刻的思考:
“我的妻子每天花费七小时在‘浏览器’中处理应用程序和文件,它更像是一个计算机或操作系统。从技术角度来看,它是一个计算环境,‘浏览器’这个词语具有误导性,我们对此一直感到不解。”
“…… 实际上,我们目前仍在努力为我们所创造的产品寻找一个合适的名字。但Hursh很早就洞察到,真正的价值并非浏览器本身,浏览器仅是基础设施,其核心价值在于用户利用它所完成的任务。”
“正如iPhone虽然被归类为手机,但其强大之处并非在于通话功能,而在于其所提供的其他多元能力。当时我认为这种说法有些玄乎,但后来的事实证明他的直觉完全正确。”
以上是本文的全部内容。文章部分内容曾首发于知识星球。感谢您的阅读。后续将持续分享AI编程、AI Agent以及AI学习方面的思考。
