2026年6月,知名开发工具公司JetBrains正式发布了其自研的开源AI模型——Mellum2。这款模型专为编程和开发者工作流设计,采用混合专家(MoE)架构,总参数量为12B,每个token仅激活2.5B参数,以Apache 2.0开源协议发布,企业可免费商用。
技术架构:轻量但高效的MoE设计
Mellum2的核心设计理念是"低延迟、高效率"。12B的总参数量在AI模型领域属于中等规模,但通过MoE架构,每个token实际只激活2.5B参数,极大降低了推理延迟和计算成本。这使得Mellum2可以在普通消费级GPU上流畅运行,特别适合私有化部署场景。
核心应用场景
JetBrains为Mellum2规划了四个核心应用场景:
- 路由(Router):作为AI工作流中的任务分配器,判断用户意图并路由到合适的Agent
- RAG检索增强生成:结合代码库检索,提供精准的代码建议
- 摘要(Summarization):自动生成代码变更摘要、PR描述和技术文档
- 子Agent:作为复杂AI工作流中的子任务执行单元
为什么JetBrains要自研模型?
作为全球最受欢迎的IDE开发商之一(IntelliJ IDEA、PyCharm、WebStorm等),JetBrains自研AI模型并非偶然:
- 深度集成需求:通用AI模型无法深度理解IDE特有的上下文(如重构历史、代码意图分析、项目结构感知)
- 延迟控制:IDE中的AI功能需要毫秒级响应,自研模型可以极致优化延迟
- 隐私合规:许多企业客户要求代码不能离开本地环境,开源模型支持私有部署
- 成本优化:长期来看,自研推理成本远低于调用第三方API
与同类开源模型对比
Mellum2的竞品包括DeepSeek Coder V2、Code Llama、StarCoder2等开源编程模型。相比这些模型,Mellum2的优势在于更小的激活参数量(2.5B vs 7B-16B),带来更低的部署成本和更快的推理速度。但在通用知识问答和长文本理解方面,参数规模限制了其上限。
优缺点分析
优点:
- Apache 2.0开源协议,企业免费商用
- 低激活参数(2.5B),推理速度快、部署成本低
- 专为编程工作流优化,路由和RAG场景表现出色
- 可私有部署,满足数据安全需求
不足:
- 通用知识能力不如大参数模型
- 生态和社区尚处于早期阶段
- 需要自行部署和维护,有一定技术门槛
评测总结
JetBrains Mellum2是一款定位清晰、设计精巧的开源编程模型。它不是要挑战GPT-5或Claude Fable这样的通用大模型,而是聚焦于一个细分场景:为开发工具和AI工作流提供一个高效、可靠、可私有部署的编程语言模型。对于使用JetBrains IDE的开发者、需要构建私有AI编程助手的团队,以及关注AI推理成本的企业来说,Mellum2是一个值得关注的选择。