OpenAI 开发者日:从产品发布到开发者赋能
与去年盛大的活动形成鲜明对比,OpenAI 在周二举办了一个更为低调的开发者日大会。与以往主打产品发布不同,今年的重点在于对现有 AI 工具和 API 的增量改进。
OpenAI 今年的重点是赋能开发者并展示社区故事,这标志着其战略的转变,因为 AI 领域竞争日益激烈。
大会上,OpenAI 公布了四大创新:视觉微调、实时 API、模型蒸馏和提示缓存。这些新工具突出了 OpenAI 战略性地转向赋能开发者生态系统,而不是直接在最终用户应用领域竞争。
其中最重大的公告之一是推出提示缓存,这项功能旨在降低开发者的成本和延迟。
该系统会自动对模型最近处理过的输入标记进行 50% 的折扣,这可能会为经常重复使用上下文的应用程序带来可观的节省。
“我们一直很忙,”OpenAI 平台产品负责人奥利维尔·戈德曼在公司旧金山总部举行的开发者大会小型新闻发布会上表示。“仅仅两年前,GPT-3 还是赢家。现在,我们已经将这些成本降低了近 1000 倍。我试图举一个技术在两年内将成本降低近 1000 倍的例子,但我找不到。”
这种大幅度的成本降低为初创企业和大型企业探索新的应用提供了重大机遇,这些应用以前由于成本过高而无法实现。
OpenAI 开发者日 2024 的定价表显示,AI 模型使用成本大幅降低,与未缓存的标记相比,缓存的输入标记在各种 GPT 模型中最多可节省 50%。新的 o1 模型展示了高级定价,反映了其先进的功能。(来源:OpenAI)
另一个重大公告是为 GPT-4o(OpenAI 最新的大型语言模型)推出视觉微调功能。这项功能允许开发者使用图像和文本来定制模型的视觉理解能力。
此更新的影响深远,可能会影响自动驾驶汽车、医学影像和视觉搜索功能等领域。
据 OpenAI 称,东南亚领先的食品配送和拼车公司 Grab 已经利用这项技术来改进其地图服务。
据报道,Grab 只用了 100 个示例就实现了车道计数准确率提高 20% 和限速标志定位提高 13% 的效果。
这个现实世界的应用证明了视觉微调的潜力,它可以使用少量视觉训练数据,在广泛的行业中显著增强 AI 驱动的服务。
OpenAI 还发布了其实时 API,目前处于公开测试阶段。这项新服务使开发者能够创建低延迟的多模态体验,尤其是在语音到语音的应用中。这意味着开发者可以开始将 ChatGPT 的语音控制添加到应用程序中。
为了说明 API 的潜力,OpenAI 展示了 Wanderlust 的更新版本,Wanderlust 是一款在去年大会上展示的旅行规划应用程序。
借助实时 API,用户可以直接与应用程序对话,进行自然对话来规划行程。该系统甚至允许在句子中间打断,模仿人类对话。
虽然旅行规划只是一个例子,但实时 API 为各种行业的语音应用程序打开了广泛的可能性。
从客户服务到教育和辅助工具,开发者现在拥有一个强大的新资源来创建更直观、更具响应性的 AI 驱动体验。
“无论何时设计产品,我们都会考虑初创企业和大型企业,”戈德曼解释道。“因此,在 alpha 版本中,我们有许多企业使用 API、新模型和新产品。”
实时 API 本质上简化了构建语音助手和其他对话式 AI 工具的过程,无需将多个模型拼接在一起进行转录、推理和文本到语音转换。
早期的采用者,如营养和健身教练应用程序 Healthify 和语言学习平台 Speak,已经将实时 API 集成到他们的产品中。
这些实施展示了 API 在从医疗保健到教育等各个领域创建更自然、更具吸引力的用户体验的潜力。
实时 API 的定价结构虽然不便宜,每分钟音频输入 0.06 美元,每分钟音频输出 0.24 美元,但对于希望创建语音应用程序的开发者来说,它仍然可能是一个重要的价值主张。
也许最具变革性的公告是模型蒸馏的推出。这种集成工作流程允许开发者使用来自 o1-preview 和 GPT-4o 等高级模型的输出,来提高 GPT-4o mini 等更高效模型的性能。
这种方法可以使规模较小的公司能够利用与高级模型类似的功能,而无需承担相同的计算成本。
它解决了 AI 行业长期存在的鸿沟,即尖端、资源密集型系统与其更易获得但能力较弱的对应系统之间的鸿沟。
假设一家小型医疗技术初创公司正在为农村诊所开发一款 AI 驱动的诊断工具。使用模型蒸馏,该公司可以训练一个紧凑的模型,该模型能够捕获大型模型的大部分诊断能力,同时可以在标准笔记本电脑或平板电脑上运行。
这可以将复杂的 AI 功能带到资源有限的环境中,有可能改善服务不足地区的医疗保健结果。
OpenAI 开发者日 2024 标志着该公司战略的转变,优先考虑生态系统发展,而不是引人注目的产品发布。
这种方法虽然对公众来说不那么令人兴奋,但它表明了对 AI 行业当前挑战和机遇的成熟理解。
今年低调的活动与 2023 年的开发者日形成了鲜明对比,当时 GPT 商店和自定义 GPT 创建工具的推出引发了类似 iPhone 的兴奋。
然而,自那以后,AI 领域发生了快速发展。竞争对手取得了重大进展,对训练数据可用性的担忧也加剧了。OpenAI 将重点放在改进现有工具和赋能开发者上,这似乎是对这些变化的深思熟虑的回应。通过提高模型的效率和成本效益,OpenAI 旨在保持其竞争优势,同时解决资源密集型和环境影响方面的担忧。
随着 OpenAI 从颠覆者转变为平台提供商,其成功在很大程度上取决于其培养繁荣的开发者生态系统的能力。
通过提供改进的工具、降低成本和增加支持,该公司正在为 AI 行业的长期增长和稳定奠定基础。
虽然直接影响可能不太明显,但这种策略最终可能会导致 AI 在许多行业中更可持续、更广泛的采用。