订阅我们的每日和每周通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
2024 年对于 Perplexity 来说是丰收的一年。这家由前 DeepMind 和 OpenAI 研究员 Aravind Srinivas 创立的 AI 搜索初创公司筹集了数亿美元——其最新一轮融资据报道对该公司的估值为 90 亿美元——并推出了几个引人注目的功能,包括 Pages、Spaces 和创新的购物体验。
这些发展巩固了 Perplexity 作为“AI 优先”知识发现引擎的地位,使其区别于 Google 和 Bing 等传统搜索巨头,后者正在将 AI 功能添加到其现有引擎中。
然而,旅程远未结束。
面对日益激烈的竞争,Perplexity 正在通过其产品组合中的一个新成员来扩展其范围:Carbon。该公司刚刚以未公开的价格收购了这家初创公司,以解决企业在 AI 搜索中遇到的“数据差距”,并简化其工作流程中的知识发现过程。
Carbon 开发了一个全面的检索框架,简化了将外部数据源连接到 LLM 的过程。用户可以利用 Carbon 通用 API 或 SDK 来同步其数据源并检索数据以与 LLM 一起使用。它提供与 20 多个数据连接器的原生集成,并支持 20 多种文件格式,包括文本、音频和视频文件。
从个人到企业用户,如今几乎每个人都在工作流程中使用 AI 搜索。这项技术的理念很简单——您不必浏览大量链接和内容来查找相关见解和信息。相反,信息将作为您查询的直接答案提供给您。
Perplexity 凭借这种方法蓬勃发展,使用一系列大型语言模型从网络检索信息,并简化了用户的工作方式。它甚至允许团队从他们的个人或商业文件(如 PDF 和 Word 文档)中提取信息。
但是,问题在于,网络是公共信息的所在地,而对于处理大量专有数据的企业用户来说,单独上传内部文件(PDF、对话、图像)是不可行的。这会影响答案的质量,使其变得通用,并缺乏重要的组织相关上下文。
前 Gartner 研究副总裁、数据和分析专家 Sanjeev Mohan 指出,这种“数据差距”是 2025 年最大的 AI 趋势之一,即针对非结构化数据的 ETL。它将允许团队从分散的内部来源提取和转换数据,最终为他们的 LLM 提供动力,以生成高度相关和准确的响应。
现在,这正是 Perplexity 计划通过收购 Carbon 的全面、简化的检索框架来实现的目标。Perplexity 将把 Carbon 的检索引擎和连接器集成到其技术堆栈中,为搜索平台的用户提供一种直接的方式来插入他们各种来源的数据,从 Google Docs 和 Notion 到 Hubspot 和 Slack。
该公司表示,这将扩大为 AI 搜索引擎提供动力的知识库,使其响应更加全面、相关和个性化。
虽然 Perplexity 刚刚收购了 Carbon,并且集成尚未执行,但很容易想象额外的连接器将如何改善使用 AI 搜索引擎的企业团队的工作流程。
例如,如果有人需要更改发布日期,并且需要了解团队制定的最新截止日期和指南,Perplexity 将能够解析 Google Docs、Notion 和 Slack 中的所有数据——并进行必要的关联——以找到回答问题的相关信息。
从本质上讲,不再需要担心从网络、单个应用程序和消息中拼凑上下文。该平台会自行完成所有操作以提供答案。
“这种设置的显著优势在于,我们的技术可以找到答案,而无需您指定存储该信息的文档/数据库,”Perplexity 的通信主管 Sara Platnick 告诉 VentureBeat。
她说,另一个例子可能是提取客户会议见解。Perplexity 将能够立即从连接的 CRM 中获取对话的详细信息和重点。
值得注意的是,通过利用 Carbon 的检索增强生成 (RAG) 工作流程,Perplexity 使企业搜索更加易于访问,为公司节省了从头开始构建自己的 RAG 管道的麻烦。
“通过使用 Perplexity 和 Carbon 查找和解释专有数据,公司可以解决一系列多方面的生成式 AI 使用案例。我们发现领先的采用者最关注客户服务、文档处理、图像处理和推荐引擎,”BARC US 的研究副总裁 Kevin Petrie 告诉 VentureBeat。
收购 Carbon 仅仅是开始。真正的关键在于执行,或者说这家初创公司的技术是如何无缝且安全地集成的。毕竟,我们谈论的是来自企业维护的一些最关键知识库的专有数据。
“公司有理由担心将他们的知识产权暴露给公众。因此,Perplexity 和 Carbon 需要提供治理控制,以确保公司可以将他们的数据保留在自己的防火墙内。他们没有兴趣分享秘密或训练一个公共模型来模仿他们的知识产权,”Petrie 补充道。
Perplexity 的 Platnick 指出,“引擎上来自内部和私人来源的所有信息都经过加密,Carbon 数据连接器中传输和存储的所有数据也是如此。”她还指出,该公司拥有额外的保护措施,以确保私人文档保持私密,并且无法被未经授权的用户访问。
目前,Carbon 与 Perplexity 集成的具体时间表尚未确定。但是,这家初创公司将在 2025 年 3 月 31 日停止其托管 API 的运营。使用该 API 的现有客户已收到有关停用的通知,Carbon 团队将协助他们进行过渡。