迈克尔·努涅斯@MichaelFNunez
2024 年 9 月 26 日 下午 3:51
来源:VentureBeat 使用 Midjourney 生成
订阅我们的每日和每周通讯,获取有关行业领先 AI 报道的最新更新和独家内容。了解更多
Together AI 在 AI 世界中掀起了一阵波澜,通过 Hugging Face 为开发者提供免费访问 Meta 强大的新 Llama 3.2 Vision 模型。
该模型被称为 Llama-3.2-11B-Vision-Instruct,允许用户上传图像并与能够分析和描述视觉内容的 AI 进行交互。
对于开发者来说,这是一个机会,可以让他们在不产生与这种规模模型相关的巨额成本的情况下,体验最先进的多模态 AI。您只需要一个来自 Together AI 的 API 密钥,就可以立即开始。
此次发布突显了 Meta 对人工智能未来的雄心勃勃的愿景,人工智能越来越依赖能够处理文本和图像的模型——这种能力被称为多模态 AI。
凭借 Llama 3.2,Meta 正在扩展 AI 的能力边界,而 Together AI 则通过免费、易于使用的演示,让更广泛的开发者社区能够访问这些先进的功能,从而发挥着至关重要的作用。
Together AI 用于访问 Meta 的 Llama 3.2 Vision 模型的界面,展示了使用先进 AI 技术的简单性,只需一个 API 密钥和可调整的参数即可。(来源:Hugging Face)
自 2023 年初发布第一个版本以来,Meta 的 Llama 模型一直处于开源 AI 开发的最前沿,挑战着 OpenAI 的 GPT 模型等专有领导者。
本周在 Meta 的 Connect 2024 活动上发布的 Llama 3.2 更进一步,集成了视觉功能,使该模型能够除了文本之外,还能处理和理解图像。
这为更广泛的应用打开了大门,从复杂的基于图像的搜索引擎到 AI 驱动的 UI 设计助手。
在 Hugging Face 上发布免费的 Llama 3.2 Vision 演示,使这些先进的功能比以往任何时候都更容易获得。
开发者、研究人员和初创公司现在可以通过简单地上传图像并实时与 AI 交互来测试该模型的多模态功能。
该演示(可在此处获得)由 Together AI 的 API 基础设施提供支持,该基础设施已针对速度和成本效益进行了优化。
尝试该模型就像从 Together AI 获取免费的 API 密钥一样简单。
开发者可以在 Together AI 的平台上注册一个帐户,其中包括 5 美元的免费积分,可以帮助您入门。设置好密钥后,用户可以将其输入 Hugging Face 界面,并开始上传图像与模型聊天。
设置过程只需几分钟,演示立即展示了 AI 在生成对视觉输入的类人响应方面取得了多大的进步。
例如,用户可以上传网站的屏幕截图或产品的照片,该模型将生成详细的描述或回答有关图像内容的问题。
对于企业来说,这为更快地原型设计和开发多模态应用程序打开了大门。零售商可以使用 Llama 3.2 为视觉搜索功能提供支持,而媒体公司可能会利用该模型来自动为文章和档案添加图像标题。
Llama 3.2 是 Meta 向边缘 AI 推进的一部分,在边缘 AI 中,更小、更高效的模型可以在移动设备和边缘设备上运行,而无需依赖云基础设施。
虽然 11B Vision 模型现在可以免费测试,但 Meta 还推出了轻量级版本,参数少至 10 亿个,专门针对设备上使用而设计。
这些模型可以在高通和联发科的移动处理器上运行,有望将 AI 驱动的功能带到更广泛的设备上。
在一个数据隐私至关重要的时代,边缘 AI 有可能通过在设备本地处理数据而不是在云中处理数据,提供更安全的解决方案。
这对于医疗保健和金融等行业至关重要,因为敏感数据必须保持安全。Meta 致力于使这些模型可修改和开源,这也意味着企业可以针对特定任务对其进行微调,而不会影响性能。
Meta 对 Llama 模型的开放承诺是对封闭、专有 AI 系统趋势的大胆反驳。
凭借 Llama 3.2,Meta 加倍相信开放模型可以通过让更多开发者参与实验和贡献,更快地推动创新。
在 Connect 2024 活动上的声明中,Meta 首席执行官马克·扎克伯格指出,与之前的版本相比,Llama 3.2 的功能增长了 10 倍,它有望在性能和可访问性方面引领行业。
Together AI 在这个生态系统中的作用同样值得注意。通过提供免费访问 Llama 3.2 Vision 模型,该公司将自己定位为开发者和企业的重要合作伙伴,这些开发者和企业希望将 AI 整合到他们的产品中。
Together AI 首席执行官 Vipul Ved Prakash 强调,他们的基础设施旨在让各种规模的企业能够轻松地在生产环境中部署这些模型,无论是在云中还是在本地。
虽然 Llama 3.2 在 Hugging Face 上可以免费获得,但 Meta 和 Together AI 明显将目光投向了企业采用。
免费层只是一个开始——随着使用量的增加,希望扩展应用程序的开发者可能需要迁移到付费计划。然而,对于现在来说,免费演示提供了一种低风险的方式来探索 AI 的前沿,对于许多人来说,这是一个改变游戏规则的机会。
随着 AI 格局不断发展,开源模型和专有模型之间的界限越来越模糊。
对于企业来说,关键的收获是,像 Llama 3.2 这样的开放模型不再仅仅是研究项目——它们已准备好用于现实世界。随着 Together AI 等合作伙伴让访问变得比以往任何时候都更容易,进入的门槛从未如此低。
想自己试试吗?前往 Together AI 的 Hugging Face 演示,上传您的第一张图像,看看 Llama 3.2 能做什么。