minimax m3发布：12小时自主炼模，解码加速15倍，多模态能力再升级-九游会j9登录入口

时间：2026-06-01 22:09 作者：陆辰风

minimax正式推出新一代旗舰大模型minimax m3，在编程与agent能力领域取得显著突破。该模型在多个基准测试中展现出领先水平，尤其在真实软件工程能力评估框架swe-bench pro上，其表现超越gpt-5.5和gemini 3.1 pro，接近claude opus 4.7。

技术架构方面，minimax m3采用全新稀疏注意力机制msa（minimax sparse attention），支持百万级上下文窗口处理。相较于前代全注意力模型m2，该架构在预填充阶段实现9倍加速，解码阶段加速效率达15倍以上。这种设计通过精确的kv块分块策略，在保持计算精度的同时显著降低资源消耗，使单token计算量仅为前代的二十分之一。

作为原生多模态模型，m3具备图片、视频输入及桌面操作能力。在omnidocbench多模态测试集中，其表现优于gemini 3.1 pro；在自主agent评测框架claw-eval上获得最高评分。训练数据规模达100万亿token级别，通过交错数据排列方式实现不同模态语义空间的深度融合。实测显示，该模型能详细描述图像细节，但在地理定位等复杂视觉任务中，与头部模型仍存在差距。

在自主训练能力测试中，m3展现惊人潜力。研究团队要求其在12小时内从零开始训练4个基础模型，全程无人干预完成数据合成、训练、评估全流程。最终这些模型在数学推理、工具调用等任务上达到基础能力水平，综合得分0.37，接近gpt-5.5（0.39）和claude opus 4.7（0.42）。在cuda内核优化任务中，该模型连续工作24小时，通过1959次工具调用将硬件利用率从7.6%提升至71.3%，实现9.4倍加速。

配套发布的ai编程工具minimax code专为m3设计，充分发挥其长上下文处理和原生多模态特性。该工具支持跨应用、跨系统操作，具备computer use能力。实测显示，m3在文档协作系统开发任务中，能主动规划技术方案、设计单元测试，并在执行过程中持续反思优化代码结构。

商业化方面，m3已通过api、token plan和minimax code平台上线。api定价采用512k上下文分档策略，提供标准模式和优先调用方案，输入输出价格分别为2.1元/百万tokens和8.4元/百万tokens，缓存读取费用0.42元/百万tokens。当前模型技术报告及权重代码计划在十日内开源，minimax code也将后续开放。

在编程任务实测中，m3展现双面性：其生成的赛车游戏界面美观但可玩性不足，动态svg图像存在细节偏差；但在复杂文档系统开发中，能准确规划技术架构并设计验证环节。这种能力特征反映出当前大模型在工程化落地过程中，既具备理解复杂工作流的潜力，仍需提升任务交付的完整性。

更多>同类内容

扫地机器人怎么选？热门品牌对比高性价比	交大医学院与华为共筑ai f5g-a全光校园：光
邯郸阿里巴巴国际站服务全解析：冀南跨境贸	天涯社区重启：重拾旧时光，让青春记忆在虚