前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

MiniMax发布业界领先400万token上下文开源LLM

NEXTECH
Last updated: 2025年3月21日 上午6:52
By NEXTECH
Share
16 Min Read
SHARE

订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多

MiniMax,这家新加坡公司,或许在美国最出名的是其背后的 Hailuo,一个与 Runway、OpenAI 的 Sora 和 Luma AI 的 Dream Machine 竞争的逼真、高分辨率生成式 AI 视频模型。

但这家公司还有更多秘密武器:例如,今天它宣布发布并开源 MiniMax-01 系列,这是一个新的模型家族,旨在处理超长上下文并增强 AI 代理开发。

该系列包括 **MiniMax-Text-01**,一个基础大型语言模型 (LLM),以及 **MiniMax-VL-01**,一个视觉多模态模型。

巨大的上下文窗口

LLM MiniMax-Text-o1 尤其引人注目,因为它在上下文窗口中可以处理多达 400 万个标记,相当于一个小图书馆的书籍数量。上下文窗口是指 LLM 在一次输入/输出交换中可以处理多少信息,其中单词和概念表示为数字“标记”,这是 LLM 对其训练数据的内部数学抽象。

虽然谷歌之前凭借其 Gemini 1.5 Pro 模型和 200 万个标记的上下文窗口领先,但 MiniMax 却将这一数字翻了一番!

正如 MiniMax 今天在其官方 X 账户上发布的那样:“MiniMax-01 有效地处理多达 400 万个标记,是其他领先模型容量的 20 到 32 倍。我们相信 MiniMax-01 有望在未来一年支持代理相关应用的预期激增,因为代理越来越需要扩展的上下文处理能力和持续的记忆。”

它们现在可以在 Hugging Face 和 Github 上下载,使用自定义 MiniMax 许可证,用户可以直接在 Hailuo AI Chat(ChatGPT/Gemini/Claude 的竞争对手)上尝试,并通过 MiniMax 的应用程序编程接口 (API),第三方开发人员可以将他们自己的独特应用程序链接到它们。

MiniMax 以具有竞争力的价格提供文本和多模态处理的 API:

  • 每 100 万个输入标记 0.2 美元
  • 每 100 万个输出标记 1.1 美元

相比之下,OpenAI 的 GPT-4o 通过其 API 每 100 万个输入标记收费 2.50 美元,贵了惊人的 12.5 倍。

MiniMax 还集成了一个具有 32 个专家的专家混合 (MoE) 框架,以优化可扩展性。这种设计在保持关键基准的竞争性能的同时,平衡了计算和内存效率。

MiniMax-01 的核心是 Lightning Attention 机制,这是一种传统 Transformer 架构的创新替代方案。

这种设计显着降低了计算复杂度。这些模型包含 4560 亿个参数,每次推理激活 459 亿个参数。

与早期的架构不同,Lightning Attention 采用线性层和传统 SoftMax 层的混合,为长输入实现了近线性复杂度。对于像我这样的新手来说,SoftMax 是将输入数字转换为概率的转换,这些概率加起来为 1,这样 LLM 就可以近似地估计输入的哪种含义最有可能。

MiniMax 已重建其训练和推理框架以支持 Lightning Attention 架构。主要改进包括:

  • MoE 全对全通信优化:减少了 GPU 间通信开销。
  • Varlen 环形注意力:最大限度地减少了长序列处理的计算浪费。
  • 高效的内核实现:定制的 CUDA 内核提高了 Lightning Attention 的性能。

这些进步使 MiniMax-01 模型能够用于现实世界的应用,同时保持经济实惠。

在主流文本和多模态基准测试中,MiniMax-01 与 GPT-4 和 Claude-3.5 等顶级模型相媲美,在长上下文评估中表现尤为出色。值得注意的是,MiniMax-Text-01 在使用 400 万个标记的上下文的 Needle-In-A-Haystack 任务中取得了 100% 的准确率。

这些模型还表明,随着输入长度的增加,性能下降最小。

MiniMax 计划定期更新以扩展模型的功能,包括代码和多模态增强。

该公司将开源视为为不断发展的 AI 代理领域构建基础 AI 功能的一步。

预计 2025 年将成为 AI 代理的变革之年,对持续记忆和高效的代理间通信的需求正在增加。MiniMax 的创新旨在应对这些挑战。

MiniMax 邀请开发人员和研究人员探索 MiniMax-01 的功能。除了开源之外,其团队还欢迎技术建议和合作咨询,请发送邮件至 **model@minimaxi.com**。

凭借其对经济高效且可扩展的 AI 的承诺,MiniMax 将自己定位为塑造 AI 代理时代的关键参与者。MiniMax-01 系列为开发人员提供了激动人心的机会,让他们突破长上下文 AI 的能力边界。

Share This Article
Email Copy Link Print
Previous Article 20250320174819849.jpg 世界银行:全球就业危机迫在眉睫,城市可以帮助化解
Next Article VentureBeat/Ideogram AI 幻觉:葛兰素史克如何应对药物研发中的关键问题
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
钟南山:2025年6月底前新冠感染率将达高峰
报告
新势力卷王卖爆!零跑一季度销量大涨162% 营收破百亿
零跑汽车:2025年Q1销量87552台,同比增长162%
报告
乘联会:2025年4月国内乘用车零售175.5万辆,同比增长14.5%
报告
卡塔尔航空:2025财年利润21.5亿美元创纪录
报告

相关内容

高力热处理今 (12) 日股東臨時會通過分割旗下熱能事業部門。
AI

高力进军AI散热,成立热能科技子公司

2024年11月23日
20241114175923369.png
AI

开源视频AI新星Genmo推出Mochi 1

2024年11月14日
AI

IEEE-USA发布新指南,帮助企业应对AI风险

2024年9月23日
AI

员工热衷使用生成式AI工具,企业影子IT风险上升

2024年10月18日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?