亚马逊进军生成式AI:Nova家族强势登场
作为全球最大的科技公司之一,亚马逊在生成式AI领域的布局一直以开发工具和平台为主,并对初创公司Anthropic进行了巨额投资。然而,在近日举行的AWS re:Invent大会上,亚马逊CEO安迪·贾西宣布推出全新的AI模型家族——Nova,涵盖文本、图像和视频生成,直接与OpenAI、谷歌,甚至其投资的Anthropic展开竞争。
Nova家族包含多个针对特定用例的模型,支持200多种语言:
- Amazon Nova Micro:专注于文本生成,以低延迟和低成本提供快速响应。
- Amazon Nova Lite:多模态模型,以极低成本提供文本、图像和视频的快速处理。
- Amazon Nova Pro:多模态模型,兼具准确性、速度和成本效益,适用于各种任务。
- Amazon Nova Premier:最先进的多模态模型,用于复杂推理任务和定制模型的提取(将于2025年第一季度推出)。
- Amazon Nova Canvas:先进的图像生成模型,用于创意内容开发。
- Amazon Nova Reel:最先进的视频生成模型,提供动态功能。
所有模型都支持微调和知识蒸馏,允许客户根据其专有数据定制AI工具,以提高准确性和性能。这些模型在支持检索增强生成(RAG)方面表现出色,可以将输出与特定组织数据关联起来,从而提高可靠性。
Nova Canvas和Reel模型突出了亚马逊在创意内容生成方面的努力:
- Nova Canvas:用户可以通过自然语言文本提示编辑图像,并调整布局或配色方案。内置的安全措施,如水印和内容审核,确保负责任的AI使用。
- Nova Reel:该视频生成模型支持高级功能,包括摄像机运动控制,如平移、缩放和360度旋转。它允许创建动态的六秒视频,未来还将提供更多功能。
人类评估已经验证了该模型的功能。在A/B测试中,Nova Reel在视频质量和视频一致性方面分别以61.4%和71.6%的胜率超过了Runway的Gen-3 Alpha。
不出所料,亚马逊Nova模型与Bedrock深度集成,Bedrock是一个完全托管的服务,通过单个API简化了对高性能AI模型的访问。客户可以使用该平台来实验、评估和部署Nova模型或Bedrock上提供的其他基础模型。
亚马逊还提供了微调和蒸馏选项,允许用户根据其特定需求调整模型。亚马逊人工智能高级副总裁罗希特·普拉萨德指出,亚马逊Nova旨在解决应用程序构建者面临的常见挑战。这些模型在延迟、成本效益和信息基础方面取得了进步,为内部和外部客户提供了灵活而强大的解决方案。
使用亚马逊Nova工具进行广告的品牌报告了显著的改进,包括广告产品数量增加五倍,每个产品的图像数量增加一倍。这些工具还使广告商能够探索新的策略,例如关键词级创意优化和视频广告。
亚马逊宣布计划在2025年扩展Nova家族,增加两个模型:
- 语音到语音模型:用于自然、人性化的语音交互。
- 任意到任意模态模型:可以处理和生成文本、图像、音频和视频,实现跨模态的无缝翻译和编辑。
亚马逊强调所有Nova模型都具有内置的保护措施,确保安全性和透明度。该公司推出了AWS AI服务卡,提供有关用例、限制和负责任的AI实践的清晰文档。水印和内容审核等功能嵌入其中,以确保符合道德标准。
亚马逊Nova代表着该公司AI之旅中的重要一步,为企业和个人带来了创新的生成式AI工具。随着这些工具的普及,亚马逊将继续优先考虑为客户提供实际价值。