OpenAI 在今年 5 月展示了 ChatGPT 的一项令人惊叹的新功能:实时影像分析。这项功能让 ChatGPT 可以实时分析手机摄像头画面,识别画面中的狗狗并记住名字,甚至可以根据用户的简单操作回答相关问题。这项功能的背后是“实时影像”(Live Video)技术,它有望让 AI 能够实时观看和聆听,识别物体或宠物,提供免手动协助,并根据摄像头中的内容做出回应。
据报道,这项“实时影像”功能最早出现在测试版中,只有少数用户可以试用。目前,该功能尚未全面推广,但已经出现在 ChatGPT 最新测试版本 v1.2024.317 中。未来,它可能会以“实时相机”(Live camera)作为市场名称推出。
OpenAI 特别提醒用户,不要使用实时相机功能进行导航或与健康和安全相关的决策,因为该功能仍在优化中,需要进一步提升准确性和可靠性。
此外,有迹象表明,OpenAI 可能即将在 ChatGPT Plus 或付费订阅中推出 Live Video 的测试版。然而,对于功能正式向所有用户开放的具体时间表,OpenAI 尚未透露任何细节。
除了实时相机功能,OpenAI 早在 2024 年 5 月就曾预告对 GPT-4 的视觉和语音能力进行基础改进。尽管这些改进的具体内容尚不清楚,但显示了 OpenAI 致力于将 AI 进一步整合到用户日常使用场景中的努力。