订阅我们的每日和每周新闻简报,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
创建炫酷的生成式 AI 图像很有趣也很有用,但这并非企业所需的一切。
企业文本到图像生成不仅仅是创建图像。它还涉及与现有工作流程和其他企业 AI 工具的集成。Stability AI(Stable Diffusion 背后的供应商)深谙此道。
今天,Stability AI 和亚马逊网络服务 (AWS) 联合宣布,Stable Diffusion 3.5 Large 现已在 Amazon Bedrock 服务上提供。AWS 是唯一提供 Stability AI 旗舰模型的公共云服务。
此举不仅仅是简单的可用性。它关乎集成和市场营销策略,为 Stability AI 的努力注入新的活力,因为该公司的新任首席执行官将重点重新放在满足客户需求上。Amazon Bedrock 提供了一个统一的 API,使企业能够访问和使用多种 AI 模型,包括 Stable Diffusion。这一点很重要,因为 AWS 自身的研究表明,大多数企业同时使用多个模型。NFL 和 Stride Learning 等用户已经从这种方法中获益。
Stable Diffusion 3.5 在 Amazon Bedrock 上的部署正值 Stability AI 面临竞争日益激烈的环境之际,其竞争对手包括 Google、Midjourney、Ideogram 和 Black Forest Labs 的 Flux Pro 等。该公司旨在通过在风格、提示遵守和企业工作流程方面提供更多图像多样性来实现差异化。
“我们选择 AWS 是有原因的,”Stability AI 首席执行官 Prem Akkaraju 在接受 VentureBeat 独家采访时表示。“因为开发者和创作者都在那里,我们希望将我们的工具和模型带到他们身边。我们的目标是赋能专业内容创作者。”
竞争日益激烈的文本到图像生成 AI 环境也包括来自亚马逊的模型。12 月初,亚马逊宣布了 Amazon Nova AI 模型系列,其中包括图像生成模型。
AWS AI 和 ML 服务与基础设施副总裁 Baskar Sridharan 告诉 VentureBeat,拥有多种文本到图像生成模型可以为用户提供选择。Amazon Bedrock 为用户提供了一个统一的 API,因此他们可以使用相同的 API 选择部署平台上可用的任何模型。Sridharan 还指出,AWS 提供模型评估工具,可以帮助企业为特定部署选择最佳工具。
不出所料,Akkaraju 认为 Stable Diffusion 3.5 优于其他模型。Stability AI 通过提示遵守方面的基准测试报告支持了这一说法。
“我们的研究表明,Stable Diffusion 3.5 Large 在提示遵守方面处于市场领先地位,使模型能够紧密遵循给定的文本提示,使其成为效率和高质量性能的首选,”Akkaraju 说。
自 10 月下旬以来,Stability AI 用户可以通过该公司的 API 以及其 Stable Assistant 服务使用 Stable Diffusion 3.5 Large。
Stability AI 认为,在自己的 API 上使用 Stable Diffusion 与通过 Amazon Bedrock 使用 Stable Diffusion 之间没有实际的价格差异。对于企业用户而言,Stable Diffusion 现在在 Amazon Bedrock 上可用,真正的优势在于能够融入更大、更复杂企业工作流程。企业可以从统一的工作流程中获益,该工作流程将来自不同供应商的多个模型通过单个 API 绑定在一起。
NFL 已经在使用这种方法。
NFL 有一款名为“My Cause, My Cleats”的应用程序,它使用 Amazon Bedrock 来实现协作的、以社区为中心的定制鞋钉设计创建体验。Sridharan 解释说,该应用程序同时使用 Anthropic Claude 和 Stable Diffusion。NFL 使用 Claude 创建详细的提示,以了解用户的偏好并确定他们想要什么。然后将该提示输入 Stable Diffusion 以生成图像。整个过程和工作流程都在 Amazon Bedrock 上完成,无需在不同的服务之间跳转。
另一个从集成中获益的组织是教育供应商 Stride Learning。该公司需要图像来支持其在线学习游戏 Legends Library——大量的图像,每分钟高达 1,000 张图像。Amazon Bedrock 提供了支持 Stable Diffusion 运行的规模基础设施。除了高性能规模之外,还需要确保图像生成的输出。这就是 Amazon Bedrock Guardrails API 的用武之地。Sridharan 指出,借助护栏,Stride Learning 能够满足图像生成的负责任 AI 政策。
“当您使用单个 API 端点完成所有这些操作时,它使客户能够非常轻松地构建这些类型的应用程序,”Sridharan 说。
Stable Diffusion 3.5 的更新以及在 Amazon Bedrock 上的可用性为 Stability AI 充满事件的一年画上了句号。
该公司的创始人兼前首席执行官 Emad Mostaque 于 3 月辞职,原因是人们担心其专注度和缺乏收入。直到 6 月,Stability AI 才任命 Akkaraju 为永久替代者。
到目前为止,Akkaraju 已经领导了一系列模型更新。他还帮助引入了新的投资者,例如 Napster 创始人 Sean Parker,以及顾问,包括著名导演詹姆斯·卡梅隆(James Cameron),时间为 9 月。Akkaraju 来自视觉特效背景,曾帮助制作包括卡梅隆的《阿凡达》在内的电影。在他看来,专业视觉媒体行业将在未来几年发生彻底转型,从渲染内容转向生成内容。
“我们很高兴在创意行业工作,因为他们可能是我们能要求的最苛刻的客户,”Akkaraju 说。
展望未来,他开玩笑说 Stability AI 的计划是统治世界。不过,更严肃地说,他预计随着公司努力满足实际工作流程需求,将继续进行创新。
“我们将继续推动模型向前发展,”Akkaraju 说。“你甚至可能会看到我们在明年发布下一代图像模型,并始终处于浪潮之巅。”