前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
Agent生态

Comet与Dia相继开放:AI浏览器如何解决用户痛点?实用场景与发展挑战解析

NEXTECH
Last updated: 2025年10月15日 上午7:10
By NEXTECH
Share
36 Min Read
SHARE

Comet与Dia相继开放:AI浏览器如何解决用户痛点?实用场景与发展挑战解析

随着Comet和Dia等AI浏览器的相继开放并提供免费体验,其在解决用户痛点方面的潜力日益凸显。本文将从以下三个方面深入探讨AI浏览器:

  • AI浏览器的三个实用场景

  • AI浏览器为何诞生?

  • AI浏览器对Chrome的挑战:有,但还不够大


一、AI浏览器的三个实用场景

场景一:批量自动化操作

当用户的X账号有太多机器人关注时,系统可能会将账号判定为低质而封禁。应对这种情况的建议操作之一就是屏蔽机器人粉丝。然而,手动屏蔽大量机器人粉丝效率低下。此时,用户可以利用Comet浏览器打开自己的X个人主页,然后点击Comet右上角的Assistant,在对话框中输入指令“屏蔽我的机器人粉丝”。Comet会进入“关注者”列表,并根据识别机器人粉丝账号的逻辑(通常特征:头像默认、简介空白、无原创内容、名字随机、关注数远大于粉丝数等),依次屏蔽这些账号(如下图)。Comet AI浏览器自动屏蔽X(推特)机器人粉丝截图

同理,Comet还可以帮助用户筛选并关注符合条件的X账号,或批量回复,又或者自动完成报表生成、邮件分发、数据抓取等重复性工作。

用户无需手动操作、编写脚本,也无需调用 MCP 或 RPA,只需通过自然语言描述需求,即可告别繁琐的Prompt撰写。

You Might Also Like

AI Agent任务规划:人机协作与AI自主之争——阿里云RDS AI助手实践
洞察未来工作:微软2025年报告揭示AI如何重塑职场与组织架构
LangChain 1.0深度解析:蜕变、核心特性与迁移建议
万物皆可Agent!Anthropic官方“三步循环法”:手把手教你构建最强智能体与Claude Agent SDK多领域应用

场景二:创建快捷指令来执行日常任务

除了前面提到的批量自动化操作外,如果用户平常有一些日常任务,比如每天跟踪AI行业大事件、翻译外文博客,或者查看日程安排等,都可以在Comet中创建快捷方式来实现。在对话框输入“/”即可唤起快捷方式菜单,在菜单底部便是【+创建快捷方式】选项;Comet AI浏览器快捷指令菜单截图点击【+创建快捷方式】后,将进入快捷方式配置窗口,其中配置项包括:

  • 快捷方式名称:只能包含字母、数字、下划线和连字符,暂不支持中文。
  • 指令:即用户期望Comet执行的具体任务,该指令将直接发送至Comet。
  • 高级:包括模式(分为搜索、研究和实验室三种)、模型(可选择主流的最强模型)和来源(分为网页、学术、社交和Finance四种)。

Comet AI浏览器快捷指令配置窗口截图
配置完成后,用户后续执行该任务时,无需在对话框重复输入大段指令,只需输入快捷指令,即可快速执行这类日常任务(如下图)。

Comet AI浏览器通过快捷指令执行日常任务示意图Comet AI浏览器通过快捷指令执行日常任务示意图
场景三:多标签页对比、关联、整合等

如果用户想要横向比较三家保险公司的产品,传统方法是在浏览器中分别访问三个网站,手动记录和比对各项条款,整个过程耗时耗力;稍新一点的方法,是将这三个网站的链接复制粘贴给常用的AI工具,然后让其整合产品信息并对比。

而现在,用户只需要在Comet中打开这三家产品的产品页,然后在输入框手动@这三个网页,并输入指令即可。

例如,该功能常用于对比提供相似解决方案的GitHub项目(如下图所示,正在对比markitdown、MinerU和marker的区别),极大地提升了用户体验。

Comet AI浏览器对比GitHub项目(markitdown、MinerU、marker)截图除了对比,Comet这类AI浏览器还可以用于关联和整合信息。例如,可以将打开的PDF、表格、文档等不同格式的信息进行整合,生成一份深度报告;还可以在打开的不同信源之间进行交叉对比和角色关联。若在过去创作《网文二十五年》时能有AI浏览器辅助,其创作速度无疑将大幅缩短。

以上只是AI浏览器应用场景的冰山一角,许多过去需要通过各种浏览器插件解决的问题,现在都被融合进AI浏览器中,如同彩蛋般等待用户发现。

Dia创始人Josh Miller和Hursh Agrawal在Every的播客采访中分享过一个用户故事:“用户可能不会立即注意到某些功能,但在使用过程中会逐渐发现。比如今天早上,有用户用Dia已经有几周了。他们会发现一些彩蛋,比如在YouTube上查歌的时候,可以让Dia自动给出吉他和弦,方便弹奏。”

二、AI浏览器为何诞生?在介绍AI浏览器的实用场景时,已经给出了第一个答案:传统浏览器存在较多痛点。

2.1 传统浏览器存在较多痛点

传统浏览器,如Google Chrome、Mozilla Firefox和Apple Safari,其设计哲学根植于一个以文档为中心的互联网时代。

它们的核心功能是作为访问和渲染网页的客户端,整个交互模式主要依赖于用户的主动、精确操作,如点击链接、填写表单和手动搜索。然而,随着网络信息量的爆炸式增长和用户需求的日益复杂化,这种传统模式的局限性愈发凸显,例如:

信息检索和整合困难:在进行一项复杂任务(如撰写研究报告)时,用户可能会打开数十个甚至上百个标签页,包括学术论文、新闻网站、社交媒体等。这种“标签页地狱”使得信息检索和整合异常困难,因为用户需要在众多标签中来回切换以寻找所需内容。

传统浏览器多标签页混乱示意图

手动操作的低效与重复性:传统浏览器需要用户手动执行绝大多数操作,从简单的信息搜索到复杂的多步骤任务,如数据抓取、内容比较和跨平台信息同步。这种高度依赖人工的模式不仅效率低下,而且充满了重复性劳动。用户无法将精力集中在更高层次的思考和决策上。

这些痛点并非现在才出现,只是之前一直未能有效解决,直到LLM和Agent技术的成熟,为解决这些痛点提供了可能性。

2.2 AI技术成熟带来的机遇

在Every的播客采访中,Josh Miller(Dia创始人之一)坦言,现在有底气做Dia浏览器,正是因为技术开始变得可行。他表示:

“GPT-4o让Dia真正跑了起来。刚做Dia的时候,记得很清楚,还专门联系了OpenAI的朋友说,你们这个新模型让我们产品真的能落地了。”

Dia的发展特别像Cursor,都是一个模型能力的直接提升带来产品能力的迭代。Cursor成立于2022年,最开始也不是做代码编辑器;后面虽然做了代码编辑器,一开始也没火。它真正为大家所知,是2024年7、8月份,因为Claude-3.5-Sonnet发布了。

以GPT-4o等为代表的大语言模型,具备了强大的自然语言理解、推理和生成能力。它们能够理解用户模糊、复杂的自然语言指令,而不仅仅是关键词匹配,然后将这些指令自主地将其分解为一系列可执行的子任务,并调用相应的工具(如浏览器API、外部API)来完成这些任务。

例如,当用户下达“我想阅读有关GUI Agent的论文。请帮我找到十篇相关论文,并将它们整理成一份报告进行概述”的指令时,Fellou浏览器中的Agent就会自动将它分解为在搜索特定论文、筛选符合要求的论文、提取论文信息等多个步骤,并自动执行。这种自主任务规划与执行的能力,使得浏览器能够完成过去需要大量手动操作的复杂工作流。

Fellou AI浏览器Agent自动分解并执行复杂任务示意图

所以,AI浏览器的诞生是信息时代传统浏览器痛点与AI技术成熟共同作用下的必然结果。

传统浏览器的最终产出是信息,而AI浏览器的最终产出是结果。用户不再满足于仅仅找到信息,而是希望浏览器能够直接帮助他们完成目标。

这种范式的转移,要求浏览器具备更强的主动性、智能性和行动能力。于是便有了AI浏览器的生长空间。

AI浏览器对Chrome的挑战:有,但还不够大

AI浏览器严格来说分为两类:一类是前面提到的Comet、Dia、Fellou,属于AI Native Browser,这种是从设计之初就将AI能力深度嵌入到浏览器的内核中。另一类是在现有浏览器上叠加AI模块来增强能力,以Google Chrome、Microsoft Edge和国内厂商如360AI浏览器、夸克浏览器为代表。在AI Native Browser出现后,许多人将其视为Chrome的有力竞争者。但从StatCounter最新发布的浏览器市场份额数据看,截至2025年9月,Chrome全球桌面浏览器市场份额达73.81%,甚至较8月还提升了3.5个百分点,依然稳居全球主导地位。其他主流浏览器依次为:Edge(10.43%)、Safari(5.73%)、Firefox(4.47%)。2025年9月全球桌面浏览器市场份额统计图
虽然Comet、Dia等AI浏览器吸引不少资本关注和用户尝试。例如Comet在2025年5月月活跃搜索量达7.8亿次,环比增速超20%,但用户主要还是集中在高端订阅市场,整体体量和Chrome仍然不具可比性,甚至对比其它主流浏览器也有较远的距离。

而且Chrome、Edge等传统浏览器自身也在积极集成AI能力,来巩固和扩展市场份额。所以在短时间内,AI Native Browser对Chrome的冲击会有,但不大。

Chrome的统治力还体现在AI搜索上。硅谷知名投资人Nathan Benaich在其发布的《State of AI Report – 2025 ONLINE》中,对AI搜索模块进行了深入分析,其中提到:

尽管ChatGPT、Perplexity等AI搜索正在侵蚀Google的市场份额,但没有任何一方找到替代Google搜索作为高质量网络索引的好方法。OpenAI目前仍然选择抓取Google搜索结果。

Google搜索有着持续统治力。

Google搜索持续统治力示意图
此举也令人联想到上个月Google搜索策略的一项调整,曾引发行业震荡。

Google悄悄移除了num=100搜索参数。这意味着用户无法再一次性查看100个结果,“长尾”访问被大幅削减。现在默认的最大值是10。

这之所以重要,是因为大多数LLMs(OpenAI、Perplexity等)直接或间接地依赖谷歌索引的结果,以及它们自己的爬虫。

这种调整带来的直接结果就是:

  • 根据Search Engine Land的数据,88%的网站出现了曝光量下降。

  • Reddit,通常排名在11至100位,其LLM引用量大幅下降,股价更是下跌了15%。

对于小团队或者独立开发者来说,这意味着AEO(尤其是面向海外的AEO)会变得更难,自己的产品更难被看见。

所以,无论从AI浏览器还是AI搜索的角度,目前Chrome的地位还很难被撼动。

写在最后

用户在初期使用Comet和Dia等AI浏览器时,可能会存在一定程度的不适应。然而,经过一段时间(例如一个月)的实际体验,其带来的诸多便利将逐渐被用户所感知。

然而,许多用户目前默认使用的浏览器仍是Chrome。

对于互联网和移动互联网的早期用户而言,长期形成的Chrome浏览器使用习惯可能导致较高的产品依赖和迁移成本。然而,对AI时代的原住民来说,他们将从一开始就接触并使用AI搜索和AI浏览器,这种代际差异带来的影响将随着时间推移愈发显著。尽管Comet、Dia、Fellou等具体产品未来发展不确定,但AI浏览器作为一种新的交互范式将持续演进。

关于AI浏览器最终形态的探讨尚未有定论,但Dia创始人Josh Miller的以下两段话提供了深刻的思考:

“我的妻子每天花费七小时在‘浏览器’中处理应用程序和文件,它更像是一个计算机或操作系统。从技术角度来看,它是一个计算环境,‘浏览器’这个词语具有误导性,我们对此一直感到不解。”

“…… 实际上,我们目前仍在努力为我们所创造的产品寻找一个合适的名字。但Hursh很早就洞察到,真正的价值并非浏览器本身,浏览器仅是基础设施,其核心价值在于用户利用它所完成的任务。”

“正如iPhone虽然被归类为手机,但其强大之处并非在于通话功能,而在于其所提供的其他多元能力。当时我认为这种说法有些玄乎,但后来的事实证明他的直觉完全正确。”

以上是本文的全部内容。文章部分内容曾首发于知识星球。感谢您的阅读。后续将持续分享AI编程、AI Agent以及AI学习方面的思考。

TAGGED:AI浏览器Comet Dia效率工具智能体用户痛点
Share This Article
Email Copy Link Print
Previous Article Discord 数据泄露事件示意图 Discord指责供应商数据泄露,供应商5CA反驳:我们“未被黑客攻击”
Next Article 20251015070952350.jpg OpenAI设立AI与福祉专家委员会:在监管与诉讼下的安全策略
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

Agent展望期对实时动态网络语料的需求
Agent生态

2025 Agent热潮:语料如何赋能AI落地与ISV变现,解析其关键作用与发展阶段

2025年10月20日
Claude Agent Skills 示例
Agent生态

Claude Agent Skills:Anthropic赋能AI智能体专业任务执行

2025年10月30日
OpenAI Agent Builder 界面预览图
Agent生态

OpenAI DevDay重磅发布:Agent Builder登场,拖拽构建AI应用,连接万物

2025年10月7日
Dify多可用区高可用部署架构示意图
Agent生态

从99.9%到99.99%:Dify高可用部署的5大实战方案

2025年10月6日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up