Meta 刚刚发布了其 Llama 人工智能模型的最新版本,该模型拥有多语言技能和先进的性能指标,可与 OpenAI 等行业顶级付费模型相媲美。
根据 Meta 发布的一系列博客文章和研究论文,Meta 的 Llama 系列的新版本被称为 Llama 3.1,现在支持八种语言,提供卓越的计算机代码质量,并且能够更轻松地解决复杂的数学问题。
Llama 3.1 技术有三个不同版本,包括 Meta 迄今为止开发的最大、最强大的 AI 模型。与之前的版本一样,Llama 3.1 仍然是开源的,可以免费使用其强大的功能。
此次发布表明 Meta 致力于与人工智能领域的主要参与者竞争,例如 OpenAI、Anthropic、Google 和 Amazon。Meta 在人工智能方面的大量投资凸显了其与这些科技巨头保持竞争力的意图。
“到目前为止,开源大型语言模型在性能和功能方面一直落后于专有模型。今天标志着开源占据主导地位的转折点。我们很自豪地推出 Meta Llama 3.1 405B,这是世界上最大、功能最强大的开放基础模型。所有 Llama 版本的下载量总计超过 3 亿次,这仅仅是个开始,”Meta 在一篇博客文章中宣称。
此次发布也凸显了 Meta 与 Nvidia 日益密切的合作。Nvidia 继续发挥关键作用,为 Meta 提供训练其 AI 模型(包括 Llama 3.1)所必需的 GPU。
骆驼 3.1 405B
与通过付费访问和辅助服务将其模型货币化的 OpenAI 不同,Meta 不打算推出竞争性企业业务。相反,Meta 采取了与其 Llama 2 版本类似的方法,与多家科技公司合作,通过其云计算平台提供 Llama 3.1。这些合作伙伴包括亚马逊网络服务、谷歌云、微软 Azure、Databricks 和戴尔,他们还将为新软件提供安全和管理工具。
新的 Llama 模型配备了扩展的“上下文窗口”,使其能够处理更大的用户输入并提高性能,特别是在生成计算机代码方面。Meta 生成 AI 负责人 Ahmad Al-Dahle 指出,此次升级通过为模型提供“更长的记忆”来更好地管理多步骤任务,解决了社区的反馈。
Meta 向开发者免费提供其 Llama 模型的策略旨在促进创新并增强其社交网络的参与度。虽然一些投资者对相关成本表示担忧,但 Meta 认为,鼓励开发者使用其免费模型可能会破坏付费竞争对手的商业模式。
Llama 3.1 模型评估
在最新版本中,Meta 用 150 多个涵盖多种语言的基准数据集对 Llama 3.1 进行了评估。评估还包括全面的人工评估,将 Llama 3.1 与实际场景中的领先模型进行了比较。早期的结果表明,Llama 3.1 在各种任务中都比顶级基础模型(如 GPT-4、GPT-4o 和 Claude 3.5 Sonnet)表现强劲。此外,Meta 的小型 Llama 模型在与具有相似参数数量的专有和开放模型进行比较时表现出了竞争力。
Meta 测试的初步结果显示,Llama 3.1 在性能基准测试中取得了令人瞩目的进步。例如,在评估复杂数学问题的 MATH 基准测试中,Llama 3.1 得分为 73.8,接近竞争对手 GPT-4o(76.6)和 Claude 3.5 Sonnet(71.1)的得分。在涵盖各个学科的 MMLU 基准测试中,Llama 3.1 的得分为 88.6,略低于 GPT-4o(88.7),但超过了 Claude 3.5 Sonnet(88.3)。
此外,Meta 的研究论文还暗示了 Llama 3.1 未来的“多模式”版本,它将融合图像、视频和语音处理功能。早期测试表明,这些即将推出的模型将与其他多模式技术(如 Google 的 Gemini 1.5 和 Anthropic 的 Claude 3.5 Sonnet)展开有效竞争。