minimax

MiniMax M2.5

MiniMax M2.5 是一款 SOTA MoE model,具备 1M context window 和顶尖的 agentic 编程能力,并以颠覆性的价格为自主智能体提供动力。

Agentic AIMoE 架构编程专家高性价比
minimax logominimaxMiniMax M 系列2026年2月12日
上下文
1.0Mtokens
最大输出
128Ktokens
输入价格
$0.30/ 1M
输出价格
$1.20/ 1M
模态:TextImage
能力:视觉工具流式传输推理
基准测试
GPQA
62%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 MiniMax M2.5 在此基准测试中得分 62%。
HLE
28%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 MiniMax M2.5 在此基准测试中得分 28%。
MMLU
85%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 MiniMax M2.5 在此基准测试中得分 85%。
MMLU Pro
76.5%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 MiniMax M2.5 在此基准测试中得分 76.5%。
SimpleQA
44%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 MiniMax M2.5 在此基准测试中得分 44%。
IFEval
87.5%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 MiniMax M2.5 在此基准测试中得分 87.5%。
AIME 2025
45%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 MiniMax M2.5 在此基准测试中得分 45%。
MATH
72%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 MiniMax M2.5 在此基准测试中得分 72%。
GSM8k
95.8%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 MiniMax M2.5 在此基准测试中得分 95.8%。
MGSM
92.4%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 MiniMax M2.5 在此基准测试中得分 92.4%。
MathVista
65%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 MiniMax M2.5 在此基准测试中得分 65%。
SWE-Bench
80.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 MiniMax M2.5 在此基准测试中得分 80.2%。
HumanEval
89.6%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 MiniMax M2.5 在此基准测试中得分 89.6%。
LiveCodeBench
65%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 MiniMax M2.5 在此基准测试中得分 65%。
MMMU
68%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 MiniMax M2.5 在此基准测试中得分 68%。
MMMU Pro
54%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 MiniMax M2.5 在此基准测试中得分 54%。
ChartQA
88%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 MiniMax M2.5 在此基准测试中得分 88%。
DocVQA
93.2%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 MiniMax M2.5 在此基准测试中得分 93.2%。
Terminal-Bench
52%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 MiniMax M2.5 在此基准测试中得分 52%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 MiniMax M2.5 在此基准测试中得分 12%。

关于 MiniMax M2.5

了解 MiniMax M2.5 的功能、特性以及它如何帮助您获得更好的效果。

高效的前沿智能

MiniMax M2.5 代表了 frontier 级 AI 效率的重大突破。作为一款 Mixture-of-Experts (MoE) 模型,它采用了拥有 2300 亿总参数的稀疏架构,但每个 token 仅激活 100 亿参数。这种设计使其能够提供与全球 flagship 模型竞争的性能,同时保持显著更快的速度和更低的运行成本。该模型于 2026 年初发布,专门针对 AI 必须在多步任务中进行规划、执行和自我修正的 “agentic” 工作负载进行了优化。

架构推理与编程

M2.5 最显著的特征之一是其涌现出的架构思维。与线性生成代码的标准 LLM 不同,M2.5 经过训练,可以在编写文件之前映射出项目层级和逻辑结构。这种能力结合 100 万 token 的 context window,使其成为自主软件工程、大规模代码审查和复杂仓库管理的卓越选择。它支持 10 多种编程语言,原生吞吐量高达每秒 100 tokens。

MiniMax M2.5

MiniMax M2.5 的使用案例

发现使用 MiniMax M2.5 获得出色效果的不同方式。

Agentic 软件工程

:在沙盒环境中使用 Architect 模式自主生成和测试多文件项目。

高精度办公自动化

:在 Word、PowerPoint 和 Excel 中执行复杂任务,包括专业的财务建模。

自主网络调研

:导航信息密集型网页,执行专家级的信息检索与综合。

双语技术支持

:在复杂的调试和架构规划中提供中文和英文的母语级流畅度。

3D 模拟原型设计

:单次 prompt 即可生成功能性的 3D 环境和交互式组件(如 Three.js)。

企业级代码审查

:跨 10 多种编程语言进行全面的代码审查和系统测试,并提供架构级的监督。

优势

局限性

颠覆性的性价比: :每 1M tokens 仅需 $0.30/$1.20,以全球竞争对手一小部分的价格提供顶级智能。
偶发逻辑错误: :初始生成的“单次”代码在复杂动画中可能包含逻辑不一致等功能错误。
架构规划能力: :该 model 展示了在生成代码之前勾勒项目层级和逻辑结构的独特能力。
地理延迟: :亚太地区以外的用户在没有本地边缘部署中心的情况下,可能会遇到较高的 latency。
极致推理速度: :原生 100 TPS 的推理速度使其成为交互式工作流中最快的 frontier model 之一。
现实知识差距: :虽然技术上准确,但在 3D 生成中偶尔难以精确对齐特定领域的现实物体。
顶尖编程表现: :针对真实世界的软件工程进行了专项优化,在 SWE-Bench Verified 上达到 80.2%。
指令敏感度: :除非在提示中非常明确地要求避免多文件扩散,否则在处理复杂任务时可能会忽略“单脚本”限制。

API快速入门

minimax/minimax-m2.5

查看文档
minimax SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: "https://api.minimax.chat/v1",
});

async function main() {
  const response = await client.chat.completions.create({
    model: "minimax-m2.5",
    messages: [{ role: "user", content: "Plan like an architect and code a 3D Formula 1 car drifting." }],
  });
  console.log(response.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 MiniMax M2.5 的评价

看看社区对 MiniMax M2.5 的看法

"MiniMax M2.5 是一款顶级的编程和 agentic 模型,速度更快且价格大幅降低。"
WorldofAI
youtube
"M2.5 的速度在 agent 循环中会产生叠加效应。它是为全天候生产负载量身定制的。"
MarketingNetMind
reddit
"它感觉更像是一个不知疲倦的助手,而不是一个迟钝的机器人。这种速度对我的配置来说是真正的游戏规则改变者。"
bruckout
reddit
"这看起来是一个真正的变革者……成本仅为闭源 flagship 模型的十分之一。"
Techmeme
facebook
"它在 SWE Bench Verified 上达到了 80.2%。这是 agent 经济效益的一个数量级跃迁。"
jackhnels
x
"架构规划模式终于让自主编程 agent 对于开发团队来说变得足够可靠。"
logic_pro
hackernews

关于 MiniMax M2.5 的视频

观看关于 MiniMax M2.5 的教程、评测和讨论

“它终于让‘智能廉价到无需计量’的设想成为了现实。”

“质量绝对过硬……即使是复杂的前端动画,其功能性也令人惊叹。”

“这个模型目前简直是在横扫编程 benchmarks。”

“它在 agent 循环中自我修正的能力是其区别于 M2.1 的核心。”

“在今年的所有发布中,我还没见过这种级别的性价比。”

“相较于前几代产品,M2.5 像建筑师一样思考和规划的能力有了显著提升。”

“这将会成为一个非常非常强大的 agentic 编程工具。”

“注意看它在编写实际 React 组件之前是如何拆解文件夹结构的。”

“这里的 reasoning 能力远超其活跃 parameters 的权重。”

“如果你正在构建自主开发 agent,你需要立即测试这个模型。”

“如果你想将其用于自己的工作流,编程方面可能会获得非常好的结果。”

“他们确实没有掉队……在整体性能上正在不断逼近。”

“其 multimodal 视觉支持处理复杂 UI 线框图的效果比某些闭源模型还要好。”

“我们看到一种趋势,对于 agent 来说,速度正变得与原始智能一样重要。”

“M2.5 代表了 MiniMax 生态系统面向全球开发者的成熟。”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

MiniMax M2.5专业提示

专家提示助您充分利用MiniMax M2.5。

利用 Architect 模式

:明确提示 model “像建筑师一样规划”,以触发其更深层次的 reasoning 和文件结构拆解能力。

使用迭代反馈

:对于复杂的 3D 或 SVG 动画,针对功能错误提供反馈,以充分利用 model 的 agentic 自我修正能力。

管理 Prompt 缓存

:利用 1M context window 的优势,通过缓存大型文档集将成本降低多达 90%。

切换 Lightning 版本

:在实时交互式 UI 编程中使用 Lightning 版本,以达到 100 TPS 的极速体验。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
other

PixVerse-R1

Other

PixVerse-R1 is a next-gen real-time world model by AIsphere, offering interactive 1080p video generation with instant response and physics-aware continuity.

关于MiniMax M2.5的常见问题

查找关于MiniMax M2.5的常见问题答案