字节跳动与阿里巴巴发布AI图像生成器,直指谷歌
产品· 3 分钟阅读1 阅读
2月10日,字节跳动和阿里巴巴同时推出AI图像生成模型,挑战谷歌在该领域的领先地位。字节跳动的Seedream 5.0集成实时网络搜索功能,阿里巴巴的Qwen-Image-2.0则在基准测试中接近谷歌Nano Banana Pro,显示中国AI公司正从成本竞争转向技术能力比拼。
中国两家最大的科技公司于2月10日发布了新的人工智能图像生成模型,在这个快速发展的市场中将自己定位为谷歌的直接竞争对手。字节跳动推出了具有行业首创实时网络搜索功能的Seedream 5.0,而阿里巴巴则发布了Qwen-Image-2.0,其基准测试得分接近当前市场领导者谷歌的Nano Banana Pro。

字节跳动推出联网图像生成功能
字节跳动的Seedream 5.0打破了传统AI图像模型的局限,将实时网络搜索集成到其生成流程中。该模型现已在视频编辑应用CapCut、其中国版本剪映,以及字节跳动的AI创作平台小云雀上线,能够在生成图像时参考热门话题和时事新闻。
根据字节跳动的官方发布,Seedream 5.0支持2K和4K图像分辨率输出,具备增强的语义理解能力,允许用户生成与实时数据相关的视觉内容,例如明星动态、时事新闻和本地化文化趋势。该模型还引入了基于画笔的交互式编辑功能和改进的图生图风格化能力。
Atlas Cloud在分析这一新版本时指出:“以前的版本完全依赖预训练的静态数据,无法像5.0这样有效地处理时事新闻、明星识别或本地化文化趋势。”
阿里巴巴通义万相2.0跻身全球排行榜
阿里云同时推出了通义万相2.0(Qwen-Image-2.0),这是一个将图像生成和编辑功能整合到单一流程中的统一模型。据多家媒体援引AI Arena评测数据报道,该模型在文生图评测中得分1,029分,位列全球第三,而其图像编辑功能获得了1,034分。
新模型在效率方面取得了技术突破,参数量从第一版的200亿缩减至70亿,同时保持了具有竞争力的性能表现。它原生支持2K分辨率和最长1,000个token的提示词,能够生成包括信息图表、海报和多格漫画在内的复杂布局。
AI图像领域竞争愈发激烈
这两款中国模型都以谷歌的Nano Banana Pro为基准进行对比,后者由该公司的Gemini 3架构驱动,提供包括4K输出、网络搜索增强和AI推理模式在内的多种功能。AI Arena排行榜目前显示,OpenAI的GPT Image 1.5和谷歌的Nano Banana Pro模型占据榜首位置。
这些产品的同步发布反映了中国AI行业更广泛的发展势头,中国公司正越来越多地在模型能力上与美国同行展开竞争,而不再仅仅着眼于成本优势。阿里巴巴的通义千问团队在X平台上表示,该模型让用户能够“输入一段文字”就能获得专业幻灯片,文本渲染“直接就能用”。
想了解 AI 如何助力您的企业?
免费获取企业 AI 成熟度诊断报告,发现转型机会
//
24小时热榜
免费获取 AI 落地指南
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断

