加拿大 AI 图像初创公司 Ideogram 推出全新画布功能,赋能创意无限
Ideogram,一家由前 Google Brain AI 研究人员创立的加拿大 AI 图像初创公司,在过去一年中凭借其文本转图像模型在 AI 创意领域崭露头角。其模型能够生成从写实到奇幻的各种风格图像,最令人印象深刻的是,它能够在图像中准确地嵌入文本,而其他领先的图像生成器,包括 Midjourney,则花了很长时间才实现这一功能,并且仍然难以可靠地生成。
现在,Ideogram 顺应潮流,将基于 Web 的用户工作区扩展到一个新的交互式无限画布。用户可以在画布上随意排列新生成的图像,将它们与旧版本进行比较,随意调整大小和重新排序,甚至将多个 AI 生成的图像组合成一个新的合成图像。
此外,用户还可以上传自己的视觉素材。借助这一新增功能,Ideogram 画布旨在简化工作流程,并提供灵活的工具,以便用户逐步完善创意项目。
当然,Ideogram 并非唯一一家超越简单聊天机器人式文本输入界面的 AI 公司。
本月早些时候,OpenAI 推出了 ChatGPT 的一个实验性新“画布”视图。与 Ideogram 的版本不同,它不提供图像辅助功能。相反,OpenAI 的版本允许用户在聊天界面旁边查看基于文本的文档和代码,并观察聊天对话如何改变右侧“画布”视图中的输出结果。
此外,Ideogram 的“画布”视图与去年由一家名为 Visual Electric 的初创公司开创的方法非常相似。Visual Electric 使用开源的 Stable Diffusion AI 图像生成模型,最近还推出了移动应用程序。然而,Ideogram 训练并提供自己的专有、从头开始的图像生成模型,例如最近推出的 Ideogram 2.0,这使其与众不同。
除了画布之外,Ideogram 还推出了两个新的功能:魔法填充和扩展。
- 魔法填充允许用户通过替换物体、添加文本、更改背景或修复缺陷来编辑图像的特定区域。该工具使用户能够专注于图像的特定区域,并使用简单的文本提示生成高分辨率细节。
- 扩展帮助用户将图像扩展到其原始边界之外,同时保持一致的风格。此工具可用于调整图像大小、调整构图或将内容适应不同的屏幕格式,而不会丢失原始结构。
这些工具旨在相互补充,使用户能够对图像进行广泛的编辑或修改,同时保持内容的整体质量和连贯性。
Ideogram 画布可用于 Ideogram 的所有使用层级,但付费计划自然会提供更多特权和功能,以及更少的限制。事实上,该公司在其社交网络 X(前身为 Twitter)上发布了一条帖子,指出所有付费计划都提供无限画布。各种选项的定价如下:
- 免费计划:每天最多允许 40 张图像,10 个慢速积分,访问 2 个画布,以及基本功能,如文本转图像生成和压缩图像下载。
- 基础计划(每月 7 美元,按年计费):每月提供 400 个优先积分,每天 100 个慢速积分,无限画布,以及访问魔法填充和扩展,以及 PNG 下载和可自定义纵横比等功能。
- Plus 计划(每月 16 美元,按年计费):增加 1,000 个优先积分,无限慢速积分,图像上传,私密生成,以及其他自定义选项。
- Pro 计划(每月 48 美元,按年计费):每月提供 3,000 个优先积分,支持最多 12,000 张图像,以及即将推出的使用 CSV 集成的批量生成功能。
此外,Ideogram 还提供自己的 API,开发人员可以使用它来构建第三方应用程序,但它只提供新的魔法填充和扩展功能,而不是画布(这很有道理,因为它与 Ideogram 的网站设计高度集成并依赖于它)。通过 API 访问模型的定价从每输入 0.01 美元(用于简单地描述图像)到每输入 0.08 美元(用于使用 Ideogram 2 生成图像)不等。
Ideogram 将 Ideogram 画布的部分开发归功于其测试版用户和 Ideogram 创意者俱乐部的成员,他们在平台测试阶段提供了反馈。该公司承认他们在完善平台的功能和设计方面做出的贡献。
作为其更广泛的增长战略的一部分,Ideogram 还指出,它正在扩大团队,并欢迎在多伦多和纽约市的招聘。该公司正在积极招聘 AI 研究、工程、营销和财务等各个领域的职位,以继续开发其 AI 工具套件。有兴趣的候选人可以通过公司的招聘页面申请。
随着 Ideogram 画布的推出,该公司希望提供一个平台,将用户生成的内容与 AI 辅助工具(如魔法填充和扩展)相结合。通过简化图像的创建和修改,Ideogram 旨在支持各个行业的创作者。