minimax

MiniMax M2.5

MiniMax M2.5 是一款 SOTA MoE 模型,具备 1M context window 和卓越的 agentic 编码能力,以颠覆性的价格为自主 agent 提供支持。

Agentic AIMoE 架构编码专家高成本效益
minimax logominimaxM-series2026年2月12日
上下文
1.0Mtokens
最大输出
128Ktokens
输入价格
$0.30/ 1M
输出价格
$1.20/ 1M
模态:TextImage
能力:视觉工具流式传输推理
基准测试
GPQA
62%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 MiniMax M2.5 在此基准测试中得分 62%。
HLE
28%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 MiniMax M2.5 在此基准测试中得分 28%。
MMLU
85%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 MiniMax M2.5 在此基准测试中得分 85%。
MMLU Pro
76.5%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 MiniMax M2.5 在此基准测试中得分 76.5%。
SimpleQA
44%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 MiniMax M2.5 在此基准测试中得分 44%。
IFEval
87.5%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 MiniMax M2.5 在此基准测试中得分 87.5%。
AIME 2025
45%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 MiniMax M2.5 在此基准测试中得分 45%。
MATH
72%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 MiniMax M2.5 在此基准测试中得分 72%。
GSM8k
95.8%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 MiniMax M2.5 在此基准测试中得分 95.8%。
MGSM
92.4%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 MiniMax M2.5 在此基准测试中得分 92.4%。
MathVista
65%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 MiniMax M2.5 在此基准测试中得分 65%。
SWE-Bench
80.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 MiniMax M2.5 在此基准测试中得分 80.2%。
HumanEval
89.6%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 MiniMax M2.5 在此基准测试中得分 89.6%。
LiveCodeBench
65%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 MiniMax M2.5 在此基准测试中得分 65%。
MMMU
68%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 MiniMax M2.5 在此基准测试中得分 68%。
MMMU Pro
54%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 MiniMax M2.5 在此基准测试中得分 54%。
ChartQA
88%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 MiniMax M2.5 在此基准测试中得分 88%。
DocVQA
93.2%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 MiniMax M2.5 在此基准测试中得分 93.2%。
Terminal-Bench
52%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 MiniMax M2.5 在此基准测试中得分 52%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 MiniMax M2.5 在此基准测试中得分 12%。

关于 MiniMax M2.5

了解 MiniMax M2.5 的功能、特性以及它如何帮助您获得更好的效果。

高效 Frontier 模型架构

MiniMax M2.5 是一款基于 230B Mixture-of-Experts (MoE) 架构的高效率 frontier model。通过在每次前向传递中仅激活 100 亿个 parameters,它实现的推理速度和定价结构比闭源巨头效率高出近 20 倍。它专为 agentic intelligence 而设计,相比简单的聊天补全,更优先考虑结构化逻辑和多步规划。这种稀疏设计使模型能够在不消耗传统密集型模型巨大计算资源的情况下保持高智能水平。

先进的编码智能

该模型最显著的特点是其架构师思维,允许其在生成代码前可视化逻辑结构和项目层级。这使其在自主软件工程领域特别有效,在 SWE-Bench Verified 上以 80.2% 的得分达到了 state-of-the-art 水平。凭借 100 万 tokens 的 context window,它可以摄入整个代码库,从而实现以往成本高昂的深度存储库审计和复杂系统重构。

企业级与本地部署

MiniMax M2.5 支持 10 多种编程语言,其 lightning 版本原生吞吐量高达每秒 100 tokens。由于它作为 open-weight 模型提供,开发者可以将其本地部署以实现完全的数据隐私,同时保留 API 中同样强大的逻辑推理能力。这种多功能性使其成为云端 agent 流水线和本地开发工具的实用选择。

MiniMax M2.5

MiniMax M2.5 的使用案例

发现使用 MiniMax M2.5 获得出色效果的不同方式。

自主软件工程

使用 agent 框架解决实际的 GitHub 问题并执行多文件调试。

企业 Agent 流水线

以低 API 成本支持全天候运行的后台 agent,用于研究和数据合成。

遗留代码现代化

在保持逻辑标准的同时,将庞大过时的代码库重构为现代框架。

架构代码审查

分析项目层级,提供逻辑反馈和结构优化建议。

大批量文档编辑

高保真地处理大型办公文档,适用于财务和法律建模。

低延迟开发工具

驱动需要亚秒级响应时间的 IDE 扩展和 CLI 工具。

优势

局限性

SOTA 编码表现: 在 SWE-Bench Verified 上获得 80.2% 的得分,性能与昂贵得多的模型不相上下。
推理深度稍欠: 稀疏的 10B 激活参数在处理极其小众的推理任务时,有时可能落后于密集型模型。
极高的成本效益: 价格约为主要竞品的 1/20,使得大规模 agent 部署变得可行。
以文本为中心: 与 GPT-4o 等 multimodal 模型相比,缺乏原生的 vision 和 audio 功能。
高吞吐量: HighSpeed 版本提供每秒 100 tokens 的速度,是传统模型的两倍。
需要品牌署名: 商业使用 open-weight 版本需要显著标注 MiniMax 品牌。
Open-Weight 可用性: 开发者可以在本地运行该模型,以确保数据隐私和完整的技术栈自主权。
VRAM 要求高: 在本地运行完整模型需要高端硬件,除非进行大幅量化。

API快速入门

minimax/minimax-m2.5

查看文档
minimax SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: 'https://api.minimax.io/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'minimax-m2.5',
    messages: [{ role: 'user', content: 'Design a microservices architecture for a fintech app.' }],
    temperature: 0.1,
  });
  console.log(response.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 MiniMax M2.5 的评价

看看社区对 MiniMax M2.5 的看法

MiniMax M2.5 的定价是真正的重头戏,便宜到足以改变架构方式,而不仅仅是预算。
PretendAd7988
twitter
M2.5 达到了 SOTA 水平,而且是一个 10B 激活参数的模型,意味着它既快又便宜。
Low-Bread-2346
reddit
该模型减轻了用户维持工作流所需的繁重工作。
JamMasterJulian
youtube
M2.5 以极低的成本达到了 Claude Opus 4.6 的吞吐量。
Significant-Tap-7854
reddit
在 Mac Studio 上本地运行 M2.5 非常迅速。10B 的激活参数真的起到了作用。
MacCoder_X
reddit
架构规划步骤在编写任何代码之前就能捕捉到逻辑错误。
dev_mindset
twitter

关于 MiniMax M2.5 的视频

观看关于 MiniMax M2.5 的教程、评测和讨论

它比顶级闭源选项便宜近 20 倍。

这是一款顶级编码和 agentic 模型,速度更快且成本大幅降低。

在 SWE-bench 验证上的表现确实使其处于精英行列。

你以开源硬件需求获得了 frontier model 的智能水平。

这里的 MoE 架构经过完美调优,适用于低延迟编码任务。

MiniMax 的模型输出 tokens 成本仅为 Opus 4.6 的 3%。

智能的成本此时已接近电费成本。

它能处理大型代码库的 context window,而不会出现典型的中间内容遗忘现象。

对于开发工具来说,lightning 版本的速度是一个巨大的 UX 胜利。

这是我第一次看到这么便宜的模型竟然能解决复杂的逻辑漏洞。

以每秒 100 tokens 的速度持续运行该模型,一小时仅需 1 美元。

内部思考过程在这里非常出色,因为它能立即进行自我纠正。

将其与 GPT-4o 对比,它始终能提供更好的多文件重构方案。

agentic 功能是内置的,不仅仅是 prompt 中的事后补救。

考虑到输入价格层级,这对小型开发者来说基本上是免费的。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

MiniMax M2.5专业提示

专家提示助您充分利用MiniMax M2.5。

采用架构师思维

在请求实现代码之前,先让模型生成项目结构。

利用 1M context window

提供完整的文档或整个模块,以确保模型对你的代码库有全局认知。

使用 HighSpeed 计划

选择 M2.5-HighSpeed 端点,为交互式 agent 实现稳定的每秒 100 tokens。

迭代优化

让模型检查其初始输出,以发现逻辑漏洞或安全风险。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

关于MiniMax M2.5的常见问题

查找关于MiniMax M2.5的常见问题答案