订阅我们的每日和每周通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
Shutterstock 正在通过一种新颖的“研究许可”方式重塑 AI 公司获取训练数据的模式,首个合作伙伴是 AI 创意技术公司 Lightricks。今天宣布的合作关系允许 Lightricks 使用 Shutterstock 庞大的高清和 4K 视频库来训练其开源视频生成模型 LTXV。
这种新的许可模式解决了 AI 开发中一个关键的挑战:获取高质量训练数据的成本高昂。它使公司能够先使用较小的研究许可进行测试和实验,然后再承诺更昂贵的商业许可。
“许多公司和模型训练者选择了未经授权的数据抓取 [而不是] 进行必要的投资以实现开发商业可行模型所需的质量和信任水平,”Shutterstock 全球数据许可和 AI 负责人丹尼尔·曼德尔在接受 VentureBeat 独家采访时表示。“然而,我们认为,对于那些希望以合乎道德的方式进入这个领域的人来说,财务投资不应成为障碍。”
这种两阶段方法可能会改变初创公司如何进行 AI 开发。Lightricks 全球公关经理克雷格·安德鲁斯将其描述为“对于希望探索生成式 AI 的创新应用,但又不想承担传统许可高昂的前期成本的较小、更敏捷的开发人员来说,这是一个转折点”。
这一时机意义重大,正值 AI 训练数据实践受到越来越多的法律审查之际。几家主要的 AI 公司因涉嫌未经授权使用受版权保护的材料进行模型训练而面临诉讼。Shutterstock 的方法提供了一种合法的替代方案,同时确保内容创作者获得报酬。
“我们正在为合乎道德的 AI 开发设定标准,同时确保创作者因其作品获得公平的报酬,”安德鲁斯解释说。“这种方法不仅促进了对创意生态系统的信任,而且为负责任的 AI 创新建立了一个可持续的框架。”
Shutterstock 实施了一种利润分成模式,贡献者从数据许可交易中获得 20% 的收入。贡献者也可以选择不将其内容用于 AI 训练,不过曼德尔指出,只有大约 1% 的人选择了这样做。
Lightricks 计划使用许可的视频数据来增强 LTXV,这是其上个月发布的开源视频生成模型。据安德鲁斯介绍,该模型已经获得了相当大的关注,在 GitHub 和 Hugging Face 上“下载量已达数千次”。一个值得注意的用例是用于交互式电子商务的实时视频生成。
此次合作旨在解决 AI 视频生成中的技术挑战,特别是较长视频中的运动一致性。“AI 视频生成中最大的技术障碍之一是在不牺牲质量的情况下,在较长的视频片段中实现一致的运动和结构,”安德鲁斯说。“Shutterstock 的高质量视频库提供了一个广泛的数据集,帮助我们解决这一挑战。”
对于 Shutterstock 来说,此次合作代表着其商业模式的战略转变。该公司已经与英伟达、Meta 和 OpenAI 等主要 AI 公司建立了合作伙伴关系。曼德尔强调,研究许可模式可以为小型组织和研究机构提供获取高质量训练数据的途径。
此次合作也反映了 AI 开发中越来越重视透明度和道德考量。Lightricks 将 LTXV 开源以促进协作和创新,而 Shutterstock 的许可方法确保了对内容创作者的适当补偿。
“这里的重要信息是,无论公司规模或资金如何,都不再有借口抓取未经许可的内容进行训练,”曼德尔总结道。“进入这个不断发展的市场,有更好的方法。”
此次合作可能会为 AI 公司获取训练数据的方式设定新的标准,可能会影响行业实践,因为人们对 AI 训练数据的来源的担忧不断加剧。这种模式的成功将决定其他内容提供商是否会效仿 Shutterstock,为 AI 开发创建更灵活、更易获得的许可选项。