AI 赋能现实世界:EndlessAI 的 Lloyd 应用如何改变用户体验
EndlessAI 是一家成立四年的 AI 初创公司,虽然尚未家喻户晓,但其创始人却坚信他们手中握着一张王牌:Lloyd,一款免费的 iOS 应用。Lloyd 利用专有的视频流和编码技术,将用户的实时视频流传输到包括 OpenAI 的 GPT-4o 在内的 AI 模型,帮助用户完成各种任务,从自行车维修到讲睡前故事,无所不能。在悄然发布三个月后,Lloyd 已经拥有了超过 50,000 名用户。
根据 EndlessAI 提供的数据,41% 的用户每天都会使用这款应用。
虽然 Lloyd 的用户数量远不及 ChatGPT(ChatGPT 在发布两个月后就突破了 1 亿用户,成为历史上增长最快的产品),但它仍然让 EndlessAI 的首席执行官 Roi Ginat 和执行主席 Thomas Pompidou 充满信心。他们在最近的一次视频通话中表示,他们计划在 2025 年初向第三方开发者开放平台,并在 1 月份推出面向消费者的 Android 版本。
此外,EndlessAI 已经开始为 Lloyd 添加“能力”,也就是 Pompidou 所说的“经过微调的大型语言模型 (LLM),为消费者提供特定用例的深入分析”。
例如,Lloyd 目前推出的第一个“能力”是“厨师”,它可以实时提供 AI 指导,在你烹饪时(将手机摄像头对准炉灶或烹饪区域)提供逐步指导。
另一个即将推出的 Lloyd “能力”是“导游”,它允许用户举起手机,实时查看周围环境的上下文信息。通过捕捉某个地点的视频,它可以识别兴趣点,提供相关信息,甚至推荐附近的景点或活动。
虽然现有的 LLM 由于计算成本高昂,难以有效地处理实时视频,但 EndlessAI 的技术克服了这一限制,将视频分析成本降低了 99% 以上。
Pompidou 强调了这款应用的更广泛使命:“我们的使命是将 AI 扩展到现实世界。现实世界是视觉化的,是实时发生的,而今天的大型语言模型在架构上难以准确、大规模且经济高效地分析视频。这就是我们所要实现的目标。”
这使得实时视频分析成为可能,让用户能够以新颖的方式与周围环境互动,从诊断机械故障到创作个性化的睡前故事。
Lloyd 的核心差异化在于它能够以极低的成本通过 LLM 处理视频数据,而这通常是此类任务的成本。传统的 LLM 架构没有针对视频进行优化,这使得实时视频分析变得非常昂贵且缓慢。
“假设 ChatGPT 可以分析视频,那么每小时的成本将超过 300 美元,”Pompidou 说。“而 Lloyd 每小时只需花费几分钱,就能提供同等水平的准确性。”
这种成本效益的实现并没有牺牲准确性,这使得 Lloyd 能够从那些为了降低成本而依赖降低帧速率或分辨率的竞争对手中脱颖而出,而这些竞争对手往往会牺牲可靠性。
“我们的通信层在其他解决方案中没有的方面非常强大。它允许开发者以无与伦比的可靠性和性能集成实时 AI 服务,例如语音转文本、文本转语音和视频分析。”
Pompidou 展望未来,他透露了这款应用的潜力:“想象一下,一个经过微调的 LLM,它接受过所有宜家说明书的训练,可以一步一步地用视频指导客户,并实时识别错误。这只是我们的技术如何改变用户体验的一个例子。”
EndlessAI 计划通过 Lloyd 及其底层视频编码技术进军另一个重要领域:执法,特别是提供对警用执法记录仪视频的分析。
“如果有人心脏病发作,它会识别出来,并立即向警官提供操作指南,”Pompidou 说。
虽然 Lloyd 本身可以准确地看到你用手机摄像头对准的任何东西,但 EndlessAI 优先考虑用户隐私。
“数据保留在 [用户] 帐户中,我们只有在用户明确请求帮助时才会访问它,”Ginat 说。
这种方法确保了强大的安全保障,同时实现了无缝互动。
但因此,EndlessAI 并不完全清楚其用户最常使用 Lloyd 做什么。据称,其调查和反馈表格显示,用户对食物准备、家居维修、时尚和生活方式指导等方面很感兴趣。
虽然 Lloyd 的面向消费者的功能正在获得关注,但 EndlessAI 也在构建工具,以帮助开发者和企业利用其技术。
“我们的长期路线图包括一个面向开发者的 SDK,将于明年年初推出,”Pompidou 说。“它将使他们能够以极高的简便性创建独特的视觉 AI 解决方案。”
SDK 将允许开发者将其 AI 视觉功能集成到自己的应用程序中。
“面向开发者的第一个产品将是一个强大的实时 API 通信平台,连接到 OpenAI 和其他后端,”Ginat 告诉 VentureBeat。“开发者可以选择使用哪些组件,例如音频服务或语音转文本。”
这些工具的应用范围涵盖各个行业,从创建 AI 增强型聊天应用程序到将视频分析集成到生产线和安全监控系统中。
EndlessAI 旨在提供可扩展的解决方案,以适应不同的性能和成本要求。
“我们的开发者工具将允许动态调整——根据用例和成本要求,选择后端服务或轻量级设备解决方案,”Ginat 补充道。
通过将强大的 API 与直观的 SDK 相结合,EndlessAI 预计将出现新一代 AI 驱动的应用程序,这些应用程序将超越传统的文本或图像处理。“我们将为开发者提供集成各种服务的能力,包括视频侧处理,通过额外的功能增强他们的会话,”Ginat 说。
Lloyd 能够利用现有的智能手机——无需额外的硬件——使其具有独特的可访问性。
通过降低进入门槛,EndlessAI 正在重新定义 AI 在日常生活和专业行业中的可能性。
凭借其快速的用户采用率、多功能的应用和强大的路线图,Lloyd 有望成为 AI 领域的一项决定性创新。
“我们的长期战略是与 LLM 保持互补,”Pompidou 说。“即使模型能够原生处理视频,我们也旨在保持效率层,使这些应用程序变得可行且经济高效。”