搜索引擎的未来:AI 驱动的对话式搜索
我们都习惯了用“谷歌一下”来形容搜索信息,但这种传统的关键词搜索方式正在被颠覆。AI 驱动的对话式搜索正在崛起,它将彻底改变我们获取信息的方式。
想象一下,你不再需要费力地输入关键词,而是直接用自然语言向搜索引擎提问。AI 会根据你的问题,从互联网上搜集信息,并以清晰易懂的语言为你提供答案,就像一位博学多识的朋友在为你解答疑惑。
谷歌,这个定义了互联网搜索的巨头,也意识到了这种趋势。他们推出了“AI 概述”功能,利用强大的语言模型,为用户提供更直接、更人性化的答案。谷歌 CEO 桑达尔·皮查伊将这形容为“搜索领域的一次重大变革”。
AI 概述:搜索引擎的全新体验
AI 概述改变了搜索引擎的运作方式。它不再仅仅提供链接,而是直接给出答案,并根据你的问题提供相关信息,例如:你计划去日本旅行,想知道东京周边有哪些节日活动、镰仓的海浪状况以及当地有哪些乐队演出,AI 概述就能为你提供这些信息。
更重要的是,AI 概述可以帮助你解决那些以前难以搜索的问题。你无需精确地描述你的需求,只需描述你遇到的问题,例如你家院子里的鸟是什么品种、冰箱出现什么故障、汽车发出什么奇怪的声音,AI 概述就能从互联网上收集相关信息,并为你提供解答。
除了谷歌,OpenAI 的 ChatGPT 也加入了这场搜索革命。ChatGPT 现在可以访问互联网,并利用其强大的语言模型,为用户提供更准确、更及时的答案。微软也推出了 Bing 的生成式搜索结果,Meta 也推出了自己的版本。这场搜索领域的变革,吸引了无数科技巨头和初创公司的目光,他们都在争夺成为下一代信息获取平台的霸主。
然而,这种变革也引发了争议。出版商们感到担忧,他们担心 AI 概述会吞噬他们的内容,导致他们失去流量和收入。他们担心未来会变成一个“零点击”的时代,人们不再需要点击链接,就能获得所有信息。
这种担忧并非空穴来风。Perplexity,一家致力于革新搜索引擎的初创公司,就曾因其 AI 概述功能而遭到出版商的起诉。Perplexity 的 AI 概述可以从各种来源收集信息,并生成全新的文章,这引发了出版商对版权和知识产权的担忧。
人们担心这些由大型语言模型驱动的搜索结果会对我们共同的现实产生影响。它可能会终结“权威答案”的时代。
除了出版商的担忧,人们也开始思考 AI 概述对我们共同现实的影响。大型语言模型可能会编造信息,甚至根据用户的个人信息提供不同的答案。这可能会导致信息混乱,甚至造成误导。
尽管存在这些问题,但 AI 驱动的对话式搜索无疑是搜索引擎的未来。它为我们提供了一种更便捷、更人性化的信息获取方式。它让我们可以更自然地与信息互动,并获得更准确、更及时的答案。
搜索引擎的演变史
搜索引擎的发展历程,也是互联网发展史的缩影。从最初的 Archie 到 Yahoo,再到 Google,搜索引擎不断进化,为我们提供了越来越强大的信息获取能力。
Archie 是第一个真正的互联网搜索引擎,它可以爬取隐藏在服务器中的文件,但它只能显示文件名,无法提供文件内容。Mosaic 的主页、IMDb、Geocities、Hampster Dance、Salon、eBay、CNN、政府网站等等,这些网站的出现,让互联网信息爆炸式增长。
为了更好地管理和获取这些信息,Yahoo 应运而生。Yahoo 是一个网站目录,它将网站按照类别进行分类,方便用户查找。但随着互联网的快速发展,Yahoo 已经无法满足人们的需求。
在 90 年代末,出现了 AltaVista、AlltheWeb、WebCrawler 和 HotBot 等搜索引擎,它们可以索引互联网上的所有内容,并根据关键词提供搜索结果。这些搜索引擎的出现,标志着搜索引擎进入了一个新的发展阶段。
然而,随着搜索引擎的普及,也出现了利用搜索引擎进行作弊的行为,例如关键词堆砌、垃圾内容填充等等。这些行为严重影响了搜索结果的质量,也让用户感到困惑。
1998 年,Google 的出现,彻底改变了搜索引擎的格局。Google 不仅索引网站内容,还分析指向网站的链接,以此来评估网站的权威性和可靠性。这种“链接分析”技术,让 Google 能够提供更准确、更相关的搜索结果。

在过去的 25 年里,Google 一直占据着搜索引擎的统治地位。Google 几乎成为了搜索的代名词。但 Google 也一直在不断发展,它不再仅仅提供链接,而是提供更直接、更全面的答案。
Google 推出了“特色片段”功能,它会从网页中提取关键信息,并将其显示在搜索结果的顶部。Google 还推出了“知识面板”功能,它从各种公共数据库和 Google 的知识图谱中获取信息,为用户提供更详细的答案。
AI 概述与这些功能不同,它可以根据用户的查询,从互联网上收集信息,并利用语言模型生成全新的答案。它就像一位博学多识的朋友,可以根据你的问题,为你提供更个性化的答案。
“我们已经索引了整个世界,并利用知识图谱建立了对世界的深度理解。我们一直在使用大型语言模型和生成式 AI 来提升我们对所有信息的理解,”皮查伊说,“但现在,我们能够利用这些信息来生成和创作。”
AI 概述让搜索引擎更像是一个对话式的助手,它可以理解你的问题,并根据你的需求提供答案。它就像一位博学多识的朋友,可以为你解答各种问题,并提供更个性化的服务。
“谷歌的使命是整理世界的信息,”谷歌搜索主管伊丽莎白·雷德说,“但实际上,我们一直在整理网页,这与整理世界的信息或让信息真正有用和易于访问并不相同。”
AI 概述正是谷歌在“易于访问”方面做出的努力。它可以帮助用户更轻松地找到答案,并提供更人性化的搜索体验。
未来,搜索引擎将超越文本查询,例如 Google Lens 可以识别图像,并提供相关信息。Google 甚至展示了对实时视频进行查询的能力。
当 AI 模型没有答案时,它可能会自信地编造一个答案。这对谷歌来说是一个真正的挑战,对我们所有人来说,这可能是危险的。
“我们正处于一个新的起点,人们将能够提出更复杂的问题,并获得更全面的答案,”皮查伊说。
然而,AI 概述也存在一些风险。首先,大型语言模型可能会编造信息,甚至提供错误的答案。这对 Google 来说是一个巨大的挑战,因为 Google 一直以可靠性著称。对于我们所有人来说,这可能是危险的。
2024 年 5 月,AI 概述在美国全面上线。但结果并不理想。Google 曾经是世界级的参考书,但现在却开始告诉人们吃石头,在披萨上涂胶水。这些错误答案大多是针对“对抗性查询”的,这些查询旨在让 AI 模型出错。但无论如何,这都让 Google 的形象受损。Google 迅速采取措施修复这些问题,例如屏蔽 Reddit 等网站上的用户生成内容,因为这些内容是错误答案的主要来源。
虽然 Google 的错误答案引起了广泛关注,但更令人担忧的是,AI 概述可能会提供一些看似合理,但实际上错误的信息。例如,在为本文进行研究时,我问 Google MIT Technology Review 什么时候上线。它回答说:“MIT Technology Review 于 2022 年底上线。”这显然是错误的,但对于不熟悉该出版物的人来说,他们可能不会意识到这个错误。
我在 Google 和 OpenAI 的 ChatGPT 搜索中都发现了类似的例子。这些信息看似合理,但实际上存在偏差。Google 相信,他们可以通过依赖高质量的来源,来提高 AI 概述的准确性。
“当我们生成 AI 概述时,”奈亚克说,“我们会寻找来自搜索结果的佐证信息,而搜索结果本身的设计尽可能来自可靠的来源。这些是我们确保即使你只阅读 AI 概述,而不进行进一步查询,我们也希望你仍然能获得可靠、可信的答案。”
在上面的例子中,2022 年的答案似乎来自一个可靠的来源——一篇关于 MIT Technology Review 电子邮件通讯的文章,该通讯于 2022 年上线。但 AI 模型却误解了信息。这就是 Google 使用人工评估员来评估搜索结果准确性的原因。评估员不会纠正或控制单个 AI 概述,而是帮助训练模型生成更准确的答案。但人工评估员也可能犯错。Google 也在努力解决这个问题。
“评估员可能不会注意到幻觉,因为它听起来很自然,”奈亚克说,“所以你必须真正努力改进评估设置,以确保当出现幻觉时,有人能够指出并说,这是一个问题。”
新搜索
谷歌已将其 AI 概述推广到 100 多个国家/地区的数十亿人,但它正面临着来自初创公司的挑战,这些初创公司对搜索的运作方式提出了新的想法。
搜索引擎
谷歌搜索巨头已将 AI 概述添加到搜索结果中。这些概述从网络和谷歌的知识图谱中获取信息,并使用该公司的 Gemini 语言模型来创建对搜索查询的答案。
擅长之处
谷歌的 AI 概述非常擅长在回答即使是最复杂的查询时也能提供易于理解的摘要,并在答案旁边提供来源框。在主要选项中,其深度网络索引感觉最“互联网化”。但网络出版商担心其摘要会让人们没有理由点击到源材料。
PerplexityPerplexity 是一款对话式搜索引擎,它使用来自 OpenAI 和 Anthropic 的第三方大型语言模型来回答查询。
Perplexity 在针对用户查询进行更深入的挖掘方面非常出色,它会生成类似于关于复杂主题的简短白皮书的答案。它在总结当前事件方面也很出色。但它在出版商中声名狼藉,出版商称它对内容的处理过于随意。
ChatGPT虽然谷歌将 AI 带入了搜索,但 OpenAI 将搜索带入了 ChatGPT。该模型确定将从网络搜索中获益的查询会自动触发搜索,或者用户可以选择手动选择添加网络搜索。
由于能够在对话中保留上下文,ChatGPT 非常适合执行从多个搜索会话中受益的搜索,例如通过多个搜索会话来规划假期。OpenAI 表示,用户有时会在查询中进行“20 轮深入”。在这三者中,它对指向出版商的链接的突出程度最低。
当我与皮查伊谈论这个问题时,他对 Google 即使在使用 LLM 生成响应的情况下也能保持准确性的能力表示乐观。这是因为 AI 概述基于 Google 的旗舰大型语言模型 Gemini,但也借鉴了知识图谱以及它认为来自网络的信誉良好的来源。
“你总是在处理百分比。我们所做的是以我所说的几近完美的信任度、真实性和质量来提供它。我想说 99.99%。我认为这是我们运作的标准,对于 AI 概述也是如此,”他说,“所以问题是,我们能否再次大规模地做到这一点?我认为我们可以。”
还有一个风险,那就是人们会向 Google 提出各种奇怪的问题。如果你想知道某人的最黑暗的秘密,看看他们的搜索历史。有时人们问 Google 的事情非常黑暗。有时它们是非法的。Google 不仅需要能够在答案有帮助时部署其 AI 概述,还需要非常小心,不要在答案可能造成伤害时部署它们。
“如果你去问‘如何制造炸弹?’ 那么有网络结果是可以的。这是开放的网络。你可以访问任何东西,”雷德说,“但我们不需要有一个 AI 概述来告诉你如何制造炸弹,对吧?我们认为这并不值得。”
但也许最大的风险——或者最大的未知数——是对于 Google 搜索的下游用户。以出版商为例,他们几十年来一直依靠搜索查询来吸引用户。如果人们能够在搜索结果中获得所有他们想要的信息,他们还有什么理由点击到原始来源呢?
SparkToro 市场研究公司联合创始人兰德·菲什金发布了关于“零点击搜索”的研究。随着 Google 越来越深入地进入答案业务,没有点击的搜索比例一直在上升。他认为 AI 概述将加速这种趋势。
“如果你依赖 Google 的流量,而这种流量是推动你业务发展的原因,那么你将面临短期和长期的麻烦,”他说。
皮查伊的口号是不要惊慌。他认为,即使在 AI 概述时代,人们仍然会想要点击链接,并深入了解许多类型的搜索。“基本原则是,人们来这里是为了寻找信息。他们并不总是希望 Google 仅仅给出答案,”他说,“有时是的,但大多数时候,你把它看作一个起点。”
与此同时,雷德认为,由于 AI 概述允许人们提出更复杂的问题,并深入了解他们想要的东西,它们甚至可能对某些类型的出版商和小型企业有所帮助,尤其是那些在利基市场运营的企业:“你实际上可以接触到新的受众,因为人们现在可以更具体地表达他们的需求,因此那些专门从事某一领域的企业不必为通用查询排名。”
“我将从一些冒险的事情开始,”尼克·特利从 Zoom 窗口中告诉我。特利是 ChatGPT 的产品主管,他展示了 OpenAI 的新网络搜索工具,距离它发布还有几周时间。“我通常应该事先尝试一下,但我只是要搜索你,”他说,“这始终是一个高风险的演示,因为人们往往对互联网上关于他们的言论很挑剔。”
他在搜索栏中输入我的名字,这个原型搜索引擎吐出了一些句子,几乎就像一个演讲者简介。它正确地识别了我和我目前的角色。它甚至突出显示了我多年前写的一篇可能是我最著名的故事。简而言之,这是正确的答案。谢天谢地?
在我们通话几周后,OpenAI 将搜索整合到 ChatGPT 中,用来自网络的信息补充了其语言模型的答案。如果该模型认为响应会从最新信息中受益,它会自动运行网络搜索(OpenAI 不会透露其搜索合作伙伴是谁),并将这些响应整合到其答案中,如果你想了解更多信息,它会提供链接。你也可以选择手动强制它搜索网络,如果它没有自行执行此操作。OpenAI 不会透露有多少人使用其网络搜索,但它表示每周有大约 2.5 亿人使用 ChatGPT,所有这些人都可能接触到它。
“网络上有大量内容。很多事情都在实时发生。你希望 ChatGPT 能够利用这些内容来改进其答案,并成为你更好的超级助手。”
OpenAI 首席产品官凯文·韦尔
根据菲什金的说法,这些更新的 AI 辅助搜索形式尚未挑战 Google 的搜索主导地位。“它似乎没有蚕食经典的网络搜索形式,”他说。
OpenAI 坚持认为,它并没有真正试图在搜索方面与 Google 竞争——尽管坦率地说,在我看来,这有点像在设定预期。相反,它表示,网络搜索主要是一种获取比其训练模型中的数据更及时信息的方式,这些模型往往有特定的截止日期,这些日期通常是几个月,甚至一年或更长时间之前。因此,虽然 ChatGPT 可能非常擅长解释西海岸进攻是如何运作的,但它长期以来一直无法告诉你最新的 49 人队得分。现在不再是了。
“我从‘如何让 ChatGPT 能够回答你所有的问题?如何让它在日常生活中对你更有用?’的角度来看待它。这就是搜索对我们来说的意义,”OpenAI 首席产品官凯文·韦尔告诉我。“网络上有大量内容。很多事情都在实时发生。你希望 ChatGPT 能够利用这些内容来改进其答案,并成为你更好的超级助手。”
如今,ChatGPT 能够为非常及时的新闻事件生成响应,以及关于股票价格等近实时信息的响应。虽然 ChatGPT 的界面长期以来一直很无聊,但搜索结果引入了各种多媒体——图像、图表,甚至视频。这是一种非常不同的体验。
韦尔还认为,与 Google(甚至其合作伙伴微软在 Bing 上)相比,ChatGPT 在创新和走自己的路方面拥有更大的自由。这两家公司都是依赖广告的企业。OpenAI 则不然。(至少现在还没有。)它从直接使用它的开发人员、企业和个人那里获得收入。它现在主要是在烧钱——据报道,它预计将在 2026 年亏损 140 亿美元。但有一件事它不必担心,那就是像 Google 一样在搜索结果中插入广告。

与 Google 一样,ChatGPT 也从网络出版商那里获取信息,对其进行总结,并将其包含在答案中。但它也与出版商达成了财务协议,即支付费用以提供被整合到其结果中的信息。(MIT Technology Review 一直在与 OpenAI、Google、Perplexity 和其他公司就出版商协议进行讨论,但尚未达成任何协议。编辑部既没有参与这些讨论,也没有被告知这些讨论的内容。)
但问题是,为了让网络搜索实现 OpenAI 的目标——比语言模型更及时——它也必须从它没有与之达成协议的各种出版商和来源那里获取信息。OpenAI 的媒体合作伙伴主管瓦伦·谢蒂告诉MIT Technology Review,它不会对其出版合作伙伴给予优惠待遇。
相反,OpenAI 告诉我,该模型本身会找到任何给定问题的最可信和最有用的来源。而这也会变得很奇怪。在它向我展示的第一个例子中——特利进行的姓名搜索——它描述了我多年前为Wired 写的一篇关于被黑客攻击的故事。那篇文章仍然是我写过的阅读量最大的文章之一。但 ChatGPT 没有链接到它。它链接到The Verge 的一篇简短改写。诚然,这是在搜索的原型版本上,正如特利所说,“有风险”。
当我问他关于这件事时,他无法真正解释为什么该模型选择了它选择的来源,因为该模型本身会进行这种评估。该公司通过识别——有时在用户的帮助下——它认为更好的答案来帮助引导它,但该模型实际上会选择它们。
“在很多情况下,它都会出错,这就是我们还有工作要做的地方,”特利说,“让模型参与进来是一种与过去搜索引擎运作方式截然不同的机制。”
的确!
无论它是 OpenAI 的 GPT-4o、Google 的 Gemini 还是 Anthropic 的 Claude,该模型都可能非常擅长解释事物。但其解释背后的理由、选择特定来源的原因,甚至它可能在答案中使用的语言,都非常神秘。当然,模型可以解释很多事情,但不能解释它自己的答案。
大约十年前,也就是 2016 年,皮查伊写道,Google 正在从“移动优先”转向“AI 优先”:“但在未来十年,我们将转向一个 AI 优先的世界,一个计算变得普遍可用的世界——无论是在家里、在工作中、在汽车里,还是在旅途中——与所有这些界面的互动变得更加自然、直观,最重要的是,更加智能。”
我们现在已经到达那里了——有点。这是一个奇怪的地方。它会变得更加奇怪。当我们现在认为是截然不同的东西——查询搜索引擎、提示模型、寻找我们拍摄的照片、决定我们想读、看或听什么、要求一张我们希望拍摄但没有拍摄的照片,但仍然想看到——开始合并时,情况尤其如此。
我们从生成式 AI 中看到的搜索结果最好被理解为一个中转站,而不是目的地。最重要的可能不是搜索本身;相反,搜索为 AI 模型开发人员提供了一条将实时信息整合到其输入和输出中的途径。而这打开了各种可能性。
“一个能够理解和访问网络的 ChatGPT 不仅仅是关于总结结果。它可能是关于为你做事。我认为未来在那里相当令人兴奋,”OpenAI 的韦尔说。“你可以想象让模型为你预订航班,或者订购 DoorDash,或者在未来为你完成一般的任务。一旦模型了解了如何使用互联网,一切皆有可能。”
这就是我们一直在谈论的代理未来,随着 AI 模型越来越多地利用来自互联网的实时数据,它越来越近了。
假设你将在几周后旅行。一个能够从互联网获取实时数据的代理可以根据它对你的了解和你即将进行的旅行,为你预订航班和酒店房间,预订晚餐,等等——所有这些都不需要你指导它。另一个代理可以,比如,监控你家里的污水排放量,以检测某些疾病,并根据检测结果订购测试和治疗。你将不必搜索你汽车发出的奇怪声音,因为你车上的代理已经做到了,并预约了维修。
“它并不总是仅仅进行搜索并给出答案,”皮查伊说。“有时它会采取行动。有时你会在现实世界中进行互动。因此,存在一个通过所有这些实现通用帮助的概念。”
这些东西提供答案的方式也正在迅速发展。例如,如今 Google 不仅可以搜索文本、图像,甚至视频;它还可以创建它们。想象一下,将这种能力与跨各种格式和设备的搜索叠加在一起。“向我展示一只树林里的托氏莺长什么样。”或者“使用我现有的家庭照片和视频来制作我们明年去波多黎各度假的电影预告片,确保我们参观所有最好的餐厅和顶级地标。”
“我们主要是在输入端做到了这一点,”他说,指的是 Google 现在可以搜索图像或视频的方式。“但你可以想象它在输出端也是如此。”
皮查伊说,他很高兴将这种未来带到网上。Google 已经展示了这种未来可能是什么样子,例如 NotebookLM,它允许你上传大量文本并将其转换为一个健谈的播客。他想象这种功能——将一种类型的输入转换为各种输出的能力——将改变我们与信息互动的方式。
在今年夏天其开发者大会上展示的“Project Astra”工具的演示中,Google 展示了这种结果的一个版本,其中手机和智能眼镜中的摄像头和麦克风理解你周围的所有环境——在线和离线,可听见和可见——并能够以各种方式回忆和响应。例如,Astra 可以查看一辆一级方程式赛车的粗略图纸,不仅识别它,而且解释它的各个部分及其用途。
但你可以想象事情会更进一步(而且它们会)。假设我想看一个关于如何修理我自行车上的东西的视频。该视频不存在,但信息存在。AI 辅助生成式搜索理论上可以从网络上的某个地方找到这些信息——例如,埋藏在公司网站上的用户手册中——并创建一个视频来向我展示如何准确地做我想做的事情,就像它今天可以用文字向我解释一样。
当我们将人类知识的全部内容——以前被捕获在语言和格式的孤岛中;地图、商业登记和产品 SKU;音频、视频和数字数据库、旧书和图像,以及实际上曾经发布、跟踪、记录的任何东西;现在正在发生的事情,无处不在——引入一个模型到所有这些中时,就会发生这些事情。一个可能无法完全理解,但能够将这些信息整合在一起、重新排列,并以各种不同的、希望有帮助的方式将其吐出来的模型。一个简单的索引无法做到的事情。
这就是我们即将发生的事情,也是我们开始看到的事情。随着 Google 将其推广到数十亿人,其中许多人将首次与对话式 AI 进行互动,这意味着什么呢?我们将如何改变?一切都变化得如此之快。坚持住,坚持住。