订阅我们的每日和每周新闻简报,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
Cerebras Systems 和 Perplexity AI 联手挑战传统搜索引擎的统治地位,宣布了一项合作关系,承诺以以前无法想象的速度提供近乎即时的 AI 驱动的搜索结果。
这项合作关系在今天发布的 VentureBeat 独家报道中宣布,其核心是 Perplexity 的新 Sonar 模型,该模型在 Cerebras 的专用 AI 芯片上以每秒 1200 个令牌的速度运行,使其成为最快的 AI 搜索系统之一。Sonar 基于 Meta 的 Llama 3.3 70B 基础构建,代表着用户将接受 AI 首选搜索体验的重大赌注,前提是这些体验足够快。
“我们与 Cerebras 的合作关系对于 Sonar 的诞生至关重要,”Perplexity 首席技术官 Denis Yarats 在一份声明中表示。“Cerebras 的尖端 AI 推理基础设施使我们能够实现前所未有的速度和效率。”
这个时机值得注意,就在 Cerebras 凭借其 DeepSeek 实现登上头条新闻的几天后,该实现展示了比传统基于 GPU 的解决方案快 57 倍的速度。该公司似乎正在利用这种势头,将自己确立为高速 AI 推理的首选提供商。
根据 Perplexity 的内部测试,Sonar 在用户满意度指标方面“大幅领先”GPT-4o mini 和 Claude 3.5 Haiku,同时与 Claude 3.5 Sonnet 等更昂贵的模型相匹配或超过这些模型。该公司的评估显示,Sonar 的事实性得分达到 100 分中的 85.1 分,而 GPT-4o 为 83.9 分,Claude 3.5 Sonnet 为 75.8 分。
这种合作关系反映了人工智能公司通过专用硬件寻求竞争优势的日益增长的趋势。Cerebras 首席执行官 Andrew Feldman 最近辩称,这种技术进步扩展了市场,而不是缩小了市场。“每次计算成本降低时,他们[公开市场投资者]都会系统地认为这会使市场变小。在过去 50 年的每一个实例中,它都使市场变得更大,”Feldman 在最近接受 ZDNET 采访时表示。
行业分析师认为,这种联盟可能会迫使传统的搜索提供商和其他人工智能公司重新考虑其硬件策略。提供近乎即时结果的能力对于企业客户来说可能特别有吸引力,因为速度和准确性直接影响生产力。
然而,关于专用 AI 芯片与传统基于 GPU 的解决方案相比的可扩展性和成本效益问题仍然存在。虽然 Cerebras 已经展示了令人印象深刻的速度优势,但该公司面临着说服客户性能优势证明潜在溢价的挑战。
这种合作关系还突出了人工智能搜索领域日益激烈的竞争格局,在这个领域,公司正在争先恐后地通过速度和准确性来区分自己,而不仅仅是模型的原始大小。对于 Perplexity 来说,它作为传统搜索引擎的 AI 原生替代方案而受到关注,与 Cerebras 的合作关系可以帮助它在企业搜索市场中确立自己的地位。
Perplexity 计划最初向 Pro 用户提供 Sonar,并将很快提供更广泛的可用性。两家公司没有透露其合作关系的财务条款。