2026年6月1日,MiniMax(稀宇科技)正式发布新一代前沿大模型MiniMax M3。这是国内首个集成了顶尖编程能力、1M超长上下文及原生多模态能力的开源大模型,旨在全面对标海外闭源旗舰模型。
M3的核心突破
M3在以下三个方面实现了重大突破:
- MSA架构(Multi-Scale Attention):首创的多尺度注意力机制,显著提升模型效率
- 1M超长上下文:支持100万token的上下文窗口,可处理超长文档和复杂任务
- 原生多模态:文本、图像、音频的统一建模,而非简单的多模态拼接
编程能力号称超过GPT-5.5
根据MiniMax官方发布的基准测试结果,M3在HumanEval、MBPP、LiveCodeBench等编程基准测试中的表现超过GPT-5.5,尤其在代码生成和调试任务中表现突出。
开源策略
M3采用开源协议发布,开发者可以免费下载、部署和商用。这一策略旨在:
- 降低AI应用开发门槛
- 建立开发者生态
- 对标Llama 4、Mistral Large等开源旗舰
与竞品对比
| 模型 | 上下文 | 多模态 | 开源 | 编程能力 |
|---|---|---|---|---|
| MiniMax M3 | 1M | 原生 | 是 | 号称超GPT-5.5 |
| GPT-5.5 | 128K | 是 | 否 | 很强 |
| Claude Opus 4.8 | 200K | 是 | 否 | 很强 |
| Llama 4 | 128K | 是 | 是 | 中等 |
行业意义
M3的发布标志着国内开源大模型进入新的里程碑。1M上下文和原生多模态的组合,将显著拓展AI应用的使用场景。