
为应对谷歌在人工智能领域的强劲攻势,OpenAI于本周二正式发布了GPT Image 1.5。此次升级被视为该公司在图像生成能力上的一次重大飞跃,旨在迅速夺回市场主导权。新模型承诺生成速度最高可达前代产品的四倍,同时增强了指令遵循能力,并配备了精准的编辑功能,确保在修改过程中保持视觉一致性。
此次发布是OpenAI对首席执行官萨姆·阿尔特曼近期所称“红色警报”局面的最新回应。在上个月的一份内部备忘录中,阿尔特曼向员工发出警告,指出在谷歌成功推出Gemini 3及其广受欢迎的Nano Banana Pro图像生成器后,公司正面临“暂时的经济逆风”。据悉,这些产品帮助谷歌Gemini在十月份实现了6.5亿的月活跃用户数。
弥合功能差距
新版ChatGPT Images现已包含一个专用的侧边栏标签页,内置预设滤镜和热门提示词。OpenAI应用部门首席执行官菲吉·西莫表示,这一改动将界面转变为一个“更像创意工作室”的工作空间。该模型显著提升了图像中的文字渲染质量——这是AI生成器长期面临的挑战——并在用户进行特定编辑时,能更好地保持面部特征、光线和构图的一致性。
西莫在周二的博客文章中写道:“对许多用户而言,初次接触ChatGPT的体验就是将一段文字提示转化为图像。然而,最初的聊天界面并非为此目的设计。创作和修改图像是一种独特的任务类型,理应拥有一个为视觉内容量身定制的专属空间。”
此次发布紧随OpenAI于12月13日推出的GPT-5.2,据称该版本的发布因竞争压力而加速。公司原计划于明年一月初推出此图像模型。此外,OpenAI上周还宣布与迪士尼达成一项价值10亿美元的合作协议,从2026年初开始,用户将能够生成包含超过200个迪士尼、漫威、皮克斯和星球大战角色的图像和视频。
图像生成领域的高风险竞争
此次发布的时机反映了AI图像生成领域日益激烈的竞争。谷歌的Nano Banana Pro因其媲美工作室品质的输出效果和自然的文字渲染而广受好评。该技术已被集成到Adobe Firefly中,使其既成为传统创意软件的竞争对手,也构成了潜在威胁。
目前,ChatGPT仍保持显著领先优势,其周活跃用户数达8亿,而Gemini的月活跃用户数为6.5亿。然而,谷歌近期的强劲势头以及在LMArena基准测试中的主导地位,迫使OpenAI加快了产品发布节奏。GPT Image 1.5现已面向全球所有ChatGPT用户及API用户开放。
