前途科技
  • 科技
  • AI
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
初创科技

Meta 推出 Llama 3.1 405B,这是其最新、最大的免费 AI 模型,具有多语言和数学技能

NEXTECH
Last updated: 2024年7月24日 上午3:15
By NEXTECH
Share
13 Min Read
SHARE

Meta 刚刚发布了其 Llama 人工智能模型的最新版本,该模型拥有多语言技能和先进的性能指标,可与 OpenAI 等行业顶级付费模型相媲美。

根据 Meta 发布的一系列博客文章和研究论文,Meta 的 Llama 系列的新版本被称为 Llama 3.1,现在支持八种语言,提供卓越的计算机代码质量,并且能够更轻松地解决复杂的数学问题。

Llama 3.1 技术有三个不同版本,包括 Meta 迄今为止开发的最大、最强大的 AI 模型。与之前的版本一样,Llama 3.1 仍然是开源的,可以免费使用其强大的功能。

此次发布表明 Meta 致力于与人工智能领域的主要参与者竞争,例如 OpenAI、Anthropic、Google 和 Amazon。Meta 在人工智能方面的大量投资凸显了其与这些科技巨头保持竞争力的意图。

“到目前为止,开源大型语言模型在性能和功能方面一直落后于专有模型。今天标志着开源占据主导地位的转折点。我们很自豪地推出 Meta Llama 3.1 405B,这是世界上最大、功能最强大的开放基础模型。所有 Llama 版本的下载量总计超过 3 亿次,这仅仅是个开始,”Meta 在一篇博客文章中宣称。

此次发布也凸显了 Meta 与 Nvidia 日益密切的合作。Nvidia 继续发挥关键作用,为 Meta 提供训练其 AI 模型(包括 Llama 3.1)所必需的 GPU。

You Might Also Like

Skylo 获英特尔资本等投资 3000 万美元 拓展全球卫星直连服务
MoneyHash获520万美元融资,简化中东和非洲支付
微软裁员应对AI发展挑战
中信集团启动“人工智能+”行动,加快发展新质生产力

骆驼 3.1 405B

与通过付费访问和辅助服务将其模型货币化的 OpenAI 不同,Meta 不打算推出竞争性企业业务。相反,Meta 采取了与其 Llama 2 版本类似的方法,与多家科技公司合作,通过其云计算平台提供 Llama 3.1。这些合作伙伴包括亚马逊网络服务、谷歌云、微软 Azure、Databricks 和戴尔,他们还将为新软件提供安全和管理工具。

新的 Llama 模型配备了扩展的“上下文窗口”,使其能够处理更大的用户输入并提高性能,特别是在生成计算机代码方面。Meta 生成 AI 负责人 Ahmad Al-Dahle 指出,此次升级通过为模型提供“更长的记忆”来更好地管理多步骤任务,解决了社区的反馈。

Meta 向开发者免费提供其 Llama 模型的策略旨在促进创新并增强其社交网络的参与度。虽然一些投资者对相关成本表示担忧,但 Meta 认为,鼓励开发者使用其免费模型可能会破坏付费竞争对手的商业模式。

Llama 3.1 模型评估

在最新版本中,Meta 用 150 多个涵盖多种语言的基准数据集对 Llama 3.1 进行了评估。评估还包括全面的人工评估,将 Llama 3.1 与实际场景中的领先模型进行了比较。早期的结果表明,Llama 3.1 在各种任务中都比顶级基础模型(如 GPT-4、GPT-4o 和 Claude 3.5 Sonnet)表现强劲。此外,Meta 的小型 Llama 模型在与具有相似参数数量的专有和开放模型进行比较时表现出了竞争力。


Meta 测试的初步结果显示,Llama 3.1 在性能基准测试中取得了令人瞩目的进步。例如,在评估复杂数学问题的 MATH 基准测试中,Llama 3.1 得分为 73.8,接近竞争对手 GPT-4o(76.6)和 Claude 3.5 Sonnet(71.1)的得分。在涵盖各个学科的 MMLU 基准测试中,Llama 3.1 的得分为 88.6,略低于 GPT-4o(88.7),但超过了 Claude 3.5 Sonnet(88.3)。

此外,Meta 的研究论文还暗示了 Llama 3.1 未来的“多模式”版本,它将融合图像、视频和语音处理功能。早期测试表明,这些即将推出的模型将与其他多模式技术(如 Google 的 Gemini 1.5 和 Anthropic 的 Claude 3.5 Sonnet)展开有效竞争。

Share This Article
Email Copy Link Print
Previous Article Multipool 获得行业巨头 Kronos Research 的战略投资
Next Article Counterpoint:2024年Q2全球智能手机销量同比增长6%
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
Sensor Tower重磅报告:2025年上半年生成式AI应用狂飙,ChatGPT能否守住霸主地位?
报告
图片 1
科技浪潮:机器人、AI与数字平台如何重塑东亚及太平洋地区劳动力市场
报告
生成式AI:从试验到价值飞跃 - 页面1
生成式AI:从试验到价值飞跃,企业重塑未来的五大关键战略
未分类
20250922100923527.jpg
特朗普H-1B签证费飙升10万:科技业紧急应对与未来挑战
科技

相关内容

初创

光互连技术助力Hyperlume解决AI数据中心瓶颈

2025年4月29日
初创科技

金融科技初创公司 Coast 获 ICONIQ Growth 领投 4000 万美元融资,帮助企业管理车队费用

2024年7月19日
20250215230616197.jpg
初创

英伟达发布$3000个人AI超级计算机,性能超普通笔记本1000倍

2025年2月16日
初创

阿里巴巴投资520亿美元押注AI

2025年5月5日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up