JetBrains Mellum2评测：专为编程优化的12B开源MoE模型

AI编程 2026-06-10 23 阅读

AI编程开源模型开发工具 JetBrains 产品评测

2026年6月，知名开发工具公司JetBrains正式发布了其自研的开源AI模型——Mellum2。这款模型专为编程和开发者工作流设计，采用混合专家（MoE）架构，总参数量为12B，每个token仅激活2.5B参数，以Apache 2.0开源协议发布，企业可免费商用。

技术架构：轻量但高效的MoE设计

Mellum2的核心设计理念是"低延迟、高效率"。12B的总参数量在AI模型领域属于中等规模，但通过MoE架构，每个token实际只激活2.5B参数，极大降低了推理延迟和计算成本。这使得Mellum2可以在普通消费级GPU上流畅运行，特别适合私有化部署场景。

核心应用场景

JetBrains为Mellum2规划了四个核心应用场景：

路由（Router）：作为AI工作流中的任务分配器，判断用户意图并路由到合适的Agent
RAG检索增强生成：结合代码库检索，提供精准的代码建议
摘要（Summarization）：自动生成代码变更摘要、PR描述和技术文档
子Agent：作为复杂AI工作流中的子任务执行单元

为什么JetBrains要自研模型？

作为全球最受欢迎的IDE开发商之一（IntelliJ IDEA、PyCharm、WebStorm等），JetBrains自研AI模型并非偶然：

深度集成需求：通用AI模型无法深度理解IDE特有的上下文（如重构历史、代码意图分析、项目结构感知）
延迟控制：IDE中的AI功能需要毫秒级响应，自研模型可以极致优化延迟
隐私合规：许多企业客户要求代码不能离开本地环境，开源模型支持私有部署
成本优化：长期来看，自研推理成本远低于调用第三方API

与同类开源模型对比

Mellum2的竞品包括DeepSeek Coder V2、Code Llama、StarCoder2等开源编程模型。相比这些模型，Mellum2的优势在于更小的激活参数量（2.5B vs 7B-16B），带来更低的部署成本和更快的推理速度。但在通用知识问答和长文本理解方面，参数规模限制了其上限。

优缺点分析

优点：

Apache 2.0开源协议，企业免费商用
低激活参数（2.5B），推理速度快、部署成本低
专为编程工作流优化，路由和RAG场景表现出色
可私有部署，满足数据安全需求

不足：

通用知识能力不如大参数模型
生态和社区尚处于早期阶段
需要自行部署和维护，有一定技术门槛

评测总结

JetBrains Mellum2是一款定位清晰、设计精巧的开源编程模型。它不是要挑战GPT-5或Claude Fable这样的通用大模型，而是聚焦于一个细分场景：为开发工具和AI工作流提供一个高效、可靠、可私有部署的编程语言模型。对于使用JetBrains IDE的开发者、需要构建私有AI编程助手的团队，以及关注AI推理成本的企业来说，Mellum2是一个值得关注的选择。

了解更多AI编程工具，请浏览AI编程工具分类和查看更多AI工具评测。