前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

JetBrains发布12B参数MoE模型Mellum2

AI 前沿2026年5月31日· 原作者:Hugging Face· 4 分钟阅读1 阅读

JetBrains开源Mellum2模型,总参数12B,每个token仅激活2.5B参数,推理速度比同类模型快2倍以上。该模型专为低延迟文本和代码任务设计,适用于路由、RAG、子智能体等高频生产场景。

JetBrains今日发布了Mellum2,一个开源的混合专家模型(MoE),专为低延迟的文本和代码工作负载优化。Mellum最初是一个代码补全模型,而Mellum2将能力扩展到了更广泛的自然语言和软件工程任务,同时保持高效的推理和易部署性。

现代AI系统越来越依赖多次模型调用:路由、检索、摘要、规划、验证和工具使用。这些操作中的许多对延迟敏感,且不需要调用最大规模的模型。Mellum2正是为这些场景而生。

基准测试亮点

Mellum2基准测试

在技术报告中,JetBrains在代码生成、推理、科学和数学基准上评估了Mellum2。Mellum2在与同等规模的开源模型竞争的同时,推理速度提升超过2倍,使其适用于高吞吐量的生产工作负载。

模型架构

Mellum2采用混合专家架构:

模型总参数每token激活参数模态许可证
Mellum212B2.5B文本和代码Apache 2.0

MoE架构在保持高模型容量的同时,每个token仅激活部分参数。这使得推理更高效,有助于降低实时工作负载的服务成本。Mellum2特意专注于文本和代码而非多模态任务,这种专精保持了模型的紧凑性,使其在软件工程工作负载中高效运行。

关键用例

路由与编排

Mellum2可作为轻量级路由和编排模型,用于多模型系统中的提示分类、工具选择和中间控制流步骤。

RAG管道

该模型非常适合延迟敏感的检索管道,包括上下文压缩、摘要和检索后处理。

子智能体

Mellum2可用于智能体的子任务,如规划、验证、转换和上下文准备,减少对更大模型的调用。

私有部署

由于Mellum2开源且服务高效,可部署在涉及专有代码或内部数据的自托管环境中。

为何范围明确的模型重要

随着AI系统成熟,最有效的架构正变得不那么单一。单个前沿模型可能很强大,但生产系统通常需要多个专业组件协同工作:检索器、路由器、代码感知模型、验证器、工具调用者和更大的推理模型。JetBrains将Mellum2视为一个“焦点”模型:一个快速、范围明确的模型,专为更大AI系统中的高频任务优化。目标不是取代堆栈中的每个模型,而是让整个堆栈更快、更便宜、更容易控制。

上手Mellum2

如果你正在构建面向软件工程的AI系统——无论是IDE内、RAG管道中、智能体工作流部分,还是私有基础设施上——Mellum2已经在Hugging Face上的模型集合中可用,欢迎尝试。

详细架构、训练设置、基准测试和评估方法,请参阅完整技术报告:https://arxiv.org/pdf/2605.31268


原文链接:Hugging Face
本文由前途科技编辑整理

标签:大语言模型开源

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

美国陆军:禁用中国设备或拖累军事数据中心
TOP1

美国陆军:禁用中国设备或拖累军事数据中心

TOP2

AI产品经理指标手册:五层、四实践、一清单

3

Neuralink植入装置恢复瘫痪患者语言与艺术能力

6小时前
Neuralink植入装置恢复瘫痪患者语言与艺术能力
4

画面党该醒醒了,用户一直在调音量

6小时前
5

流式传输:让AI响应快到飞起

6小时前
6

SkillOpt:从提示工程到技能训练

6小时前
7

分层架构正在瓦解:自治领域能力崛起

6小时前
分层架构正在瓦解:自治领域能力崛起
8

轨道清洁战:近地轨道上万亿美金的博弈

6小时前
轨道清洁战:近地轨道上万亿美金的博弈
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款