本报讯 (记者张文湘)2026年2月12日,MiniMax(上海稀宇极智科技有限公司)正式上线新一代文本模型MiniMax M2.5。当各家大模型厂商围绕“春节档”展开密集发布与营销攻势,这款定位为“原生Agent生产级模型”的产品,正式加入这场被业界称为“AI诸神之战”的竞争。
据介绍,在编程能力方面,MiniMax M2.5在权威榜单SWE-BenchVerified得分为80.2%、Multi-SWE-Bench得分为51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus4.6,达到了行业最好的水平。更重要的是,模型展现出“原生Spec能力”,在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。
工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项Agent任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20%,达到了行业顶尖水平。办公场景中,在Word、PPT、Excel金融建模等Workspace高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比中取得了59.0%的平均胜率。
据悉,MiniMax M2.5已于2月12日在MiniMax Agent上线,并于2月13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长。
MiniMax相关人士表示,希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态—Agent Universe,当模型能力、泛化性和成本都不再是瓶颈,Agent渗透到工作和生活的各个角落,从编程、办公到创作、娱乐,大幅促进Agentic应用的进一步发展。
(编辑 郭之宸)