MiniMax M2.5 的费用是多少？

该模型输入 tokens 价格为每百万 0.15 美元，输出 tokens 价格为每百万 1.20 美元。这使其比大多数旗舰级闭源模型便宜得多。

context window 大小是多少？

MiniMax M2.5 支持 1,000,000 tokens 的 context window。这非常适合管理大规模代码库或长文档。

它与 Claude Opus 相比如何？

它在 coding benchmark 中与 Opus 4.6 持平，SWE-Bench 得分达 80.2%，且速度更快、成本更低。它通过采用 sparse 架构来保持这种效率。

有更快的版本吗？

是的，M2.5-HighSpeed 版本提供每秒 100 tokens 的速度，价格为每百万输入 tokens 0.30 美元。这专为实时开发工具进行了优化。

它支持 function calling 吗？

是的，它在 Berkeley Function Calling Leaderboard 上验证了极高的 function calling 准确性。这使其能够有效地与外部 API 集成。

我可以在本地运行 MiniMax M2.5 吗？

是的，它作为 open-weight 模型提供以供本地部署。如果你想在不进行大幅量化的情况下运行完整的 230B 模型，大约需要 400GB 的 VRAM。

它使用了什么架构？

它利用了 Mixture-of-Experts 设计，总共拥有 2300 亿个 parameters。在任何单一 token 生成步骤中，只有 100 亿个 parameters 处于激活状态。

它是 multimodal 的吗？

M2.5 版本主要是文本和代码专家。对于 vision 或 audio 任务，建议使用 MiniMax 的专业 multimodal 模型。

MiniMax M2.5

MiniMax M2.5 是一款 SOTA MoE 模型，具备 1M context window 和卓越的 agentic 编码能力，以颠覆性的价格为自主 agent 提供支持。

Agentic AIMoE 架构编码专家高成本效益

minimaxM-series2026年2月12日

上下文

1.0Mtokens

最大输出

128Ktokens

输入价格

$0.30/ 1M

输出价格

$1.20/ 1M

模态:TextImage

能力:视觉工具流式传输推理

基准测试

GPQA

62%

HLE

28%

MMLU

85%

MMLU Pro

76.5%

SimpleQA

44%

IFEval

87.5%

AIME 2025

45%

MATH

72%

GSM8k

95.8%

MGSM

92.4%

MathVista

65%

SWE-Bench

80.2%

HumanEval

89.6%

LiveCodeBench

65%

MMMU

68%

MMMU Pro

54%

ChartQA

88%

DocVQA

93.2%

Terminal-Bench

52%

ARC-AGI

12%

查看API文档

关于 MiniMax M2.5

了解 MiniMax M2.5 的功能、特性以及它如何帮助您获得更好的效果。

高效 Frontier 模型架构

MiniMax M2.5 是一款基于 230B Mixture-of-Experts (MoE) 架构的高效率 frontier model。通过在每次前向传递中仅激活 100 亿个 parameters，它实现的推理速度和定价结构比闭源巨头效率高出近 20 倍。它专为 agentic intelligence 而设计，相比简单的聊天补全，更优先考虑结构化逻辑和多步规划。这种稀疏设计使模型能够在不消耗传统密集型模型巨大计算资源的情况下保持高智能水平。

先进的编码智能

该模型最显著的特点是其架构师思维，允许其在生成代码前可视化逻辑结构和项目层级。这使其在自主软件工程领域特别有效，在 SWE-Bench Verified 上以 80.2% 的得分达到了 state-of-the-art 水平。凭借 100 万 tokens 的 context window，它可以摄入整个代码库，从而实现以往成本高昂的深度存储库审计和复杂系统重构。

企业级与本地部署

MiniMax M2.5 支持 10 多种编程语言，其 lightning 版本原生吞吐量高达每秒 100 tokens。由于它作为 open-weight 模型提供，开发者可以将其本地部署以实现完全的数据隐私，同时保留 API 中同样强大的逻辑推理能力。这种多功能性使其成为云端 agent 流水线和本地开发工具的实用选择。

MiniMax M2.5 的使用案例

发现使用 MiniMax M2.5 获得出色效果的不同方式。

自主软件工程

使用 agent 框架解决实际的 GitHub 问题并执行多文件调试。

企业 Agent 流水线

以低 API 成本支持全天候运行的后台 agent，用于研究和数据合成。

遗留代码现代化

在保持逻辑标准的同时，将庞大过时的代码库重构为现代框架。

架构代码审查

分析项目层级，提供逻辑反馈和结构优化建议。

大批量文档编辑

高保真地处理大型办公文档，适用于财务和法律建模。

低延迟开发工具

驱动需要亚秒级响应时间的 IDE 扩展和 CLI 工具。

优势

局限性

SOTA 编码表现: 在 SWE-Bench Verified 上获得 80.2% 的得分，性能与昂贵得多的模型不相上下。

推理深度稍欠: 稀疏的 10B 激活参数在处理极其小众的推理任务时，有时可能落后于密集型模型。

极高的成本效益: 价格约为主要竞品的 1/20，使得大规模 agent 部署变得可行。

以文本为中心: 与 GPT-4o 等 multimodal 模型相比，缺乏原生的 vision 和 audio 功能。

高吞吐量: HighSpeed 版本提供每秒 100 tokens 的速度，是传统模型的两倍。

需要品牌署名: 商业使用 open-weight 版本需要显著标注 MiniMax 品牌。

Open-Weight 可用性: 开发者可以在本地运行该模型，以确保数据隐私和完整的技术栈自主权。

VRAM 要求高: 在本地运行完整模型需要高端硬件，除非进行大幅量化。

API快速入门

minimax/minimax-m2.5

查看文档

minimax SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: 'https://api.minimax.io/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'minimax-m2.5',
    messages: [{ role: 'user', content: 'Design a microservices architecture for a fintech app.' }],
    temperature: 0.1,
  });
  console.log(response.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 MiniMax M2.5 的评价

看看社区对 MiniMax M2.5 的看法

“MiniMax M2.5 的定价是真正的重头戏，便宜到足以改变架构方式，而不仅仅是预算。”

— PretendAd7988

twitter

“M2.5 达到了 SOTA 水平，而且是一个 10B 激活参数的模型，意味着它既快又便宜。”

— Low-Bread-2346

“该模型减轻了用户维持工作流所需的繁重工作。”

— JamMasterJulian

youtube

“M2.5 以极低的成本达到了 Claude Opus 4.6 的吞吐量。”

— Significant-Tap-7854

“在 Mac Studio 上本地运行 M2.5 非常迅速。10B 的激活参数真的起到了作用。”

— MacCoder_X

“架构规划步骤在编写任何代码之前就能捕捉到逻辑错误。”

— dev_mindset

twitter

关于 MiniMax M2.5 的视频

观看关于 MiniMax M2.5 的教程、评测和讨论

“它比顶级闭源选项便宜近 20 倍。”

“这是一款顶级编码和 agentic 模型，速度更快且成本大幅降低。”

“在 SWE-bench 验证上的表现确实使其处于精英行列。”

“你以开源硬件需求获得了 frontier model 的智能水平。”

“这里的 MoE 架构经过完美调优，适用于低延迟编码任务。”

“MiniMax 的模型输出 tokens 成本仅为 Opus 4.6 的 3%。”

“智能的成本此时已接近电费成本。”

“它能处理大型代码库的 context window，而不会出现典型的中间内容遗忘现象。”

“对于开发工具来说，lightning 版本的速度是一个巨大的 UX 胜利。”

“这是我第一次看到这么便宜的模型竟然能解决复杂的逻辑漏洞。”

“以每秒 100 tokens 的速度持续运行该模型，一小时仅需 1 美元。”

“内部思考过程在这里非常出色，因为它能立即进行自我纠正。”

“将其与 GPT-4o 对比，它始终能提供更好的多文件重构方案。”

“agentic 功能是内置的，不仅仅是 prompt 中的事后补救。”

“考虑到输入价格层级，这对小型开发者来说基本上是免费的。”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量，帮助您在更短的时间内完成更多工作。

AI代理

网页自动化

智能工作流

免费开始

MiniMax M2.5专业提示

专家提示助您充分利用MiniMax M2.5。

采用架构师思维

在请求实现代码之前，先让模型生成项目结构。

利用 1M context window

提供完整的文档或整个模块，以确保模型对你的代码库有全局认知。

使用 HighSpeed 计划

选择 M2.5-HighSpeed 端点，为交互式 agent 实现稳定的每秒 100 tokens。

迭代优化

让模型检查其初始输出，以发现逻辑漏洞或安全风险。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.