other

MiMo V2.5 Pro

MiMo V2.5 Pro 是小米的 open-source 1.02T parameters MoE model,具备 1M context window、原生多模态能力和顶尖的 agentic 编程性能。

Open SourceAgentic AIMultimodal1M ContextXiaomi
other logootherMiMo2026年4月27日
上下文
1.0Mtokens
最大输出
131Ktokens
输入价格
$1.00/ 1M
输出价格
$3.00/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
54%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 MiMo V2.5 Pro 在此基准测试中得分 54%。
HLE
48%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 MiMo V2.5 Pro 在此基准测试中得分 48%。
MMLU
86.7%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 MiMo V2.5 Pro 在此基准测试中得分 86.7%。
MMLU Pro
84.9%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 MiMo V2.5 Pro 在此基准测试中得分 84.9%。
SimpleQA
45%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 MiMo V2.5 Pro 在此基准测试中得分 45%。
IFEval
88%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 MiMo V2.5 Pro 在此基准测试中得分 88%。
AIME 2025
41%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 MiMo V2.5 Pro 在此基准测试中得分 41%。
MATH
75%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 MiMo V2.5 Pro 在此基准测试中得分 75%。
GSM8k
95.5%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 MiMo V2.5 Pro 在此基准测试中得分 95.5%。
MGSM
92%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 MiMo V2.5 Pro 在此基准测试中得分 92%。
MathVista
65%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 MiMo V2.5 Pro 在此基准测试中得分 65%。
SWE-Bench
78.9%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 MiMo V2.5 Pro 在此基准测试中得分 78.9%。
HumanEval
90%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 MiMo V2.5 Pro 在此基准测试中得分 90%。
LiveCodeBench
80.6%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 MiMo V2.5 Pro 在此基准测试中得分 80.6%。
MMMU
73%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 MiMo V2.5 Pro 在此基准测试中得分 73%。
MMMU Pro
52%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 MiMo V2.5 Pro 在此基准测试中得分 52%。
ChartQA
89%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 MiMo V2.5 Pro 在此基准测试中得分 89%。
DocVQA
93.5%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 MiMo V2.5 Pro 在此基准测试中得分 93.5%。
Terminal-Bench
68.4%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 MiMo V2.5 Pro 在此基准测试中得分 68.4%。
ARC-AGI
8%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 MiMo V2.5 Pro 在此基准测试中得分 8%。

关于 MiMo V2.5 Pro

了解 MiMo V2.5 Pro 的功能、特性以及它如何帮助您获得更好的效果。

MiMo V2.5 Pro 是小米的旗舰级 open-source model。它采用 1.02 万亿 parameters 的 Mixture-of-Experts 架构,在 inference 期间有 420 亿 parameters 处于激活状态。其混合注意力设计以 6:1 的比例融合了局部滑动窗口注意力和全局注意力。与标准 transformer model 相比,这种特殊配置将 KV-cache 存储需求降低了近 7 倍。

该 model 支持 100 万 tokens 的 context window,并支持包括文本、图像、音频和视频在内的原生 omnimodal 输入。它针对长周期 agentic 任务和自主工具使用进行了优化。开发者可以使用 FP8 精度权重在本地运行该 model,从而平衡内存使用和输出 throughput。宽松的 MIT 许可允许在无需额外费用的情况下进行修改和商业部署。

MiMo V2.5 Pro

MiMo V2.5 Pro 的使用案例

发现使用 MiMo V2.5 Pro 获得出色效果的不同方式。

自主软件工程

通过自我纠正逻辑来解决 GitHub 问题并构建编译器等系统组件。

长周期 Agent 工作流

执行需要在软件环境中保持超过 1,000 次工具调用连贯性的任务。

原生 Multimodal 分析

直接对视频和文本的组合输入进行 reasoning,无需外部预处理或帧提取。

大规模代码库导航

在 1M tokens 的 context window 内摄取整个项目仓库,以重构逻辑或查找 bug。

模拟电路设计

通过与模拟循环交互来优化复杂电路,以满足多指标规范。

3D Web 生成

使用 Three.js 和程序化地形生成技术创建复杂的环境和物理模拟。

优势

局限性

低 token 消耗: 在提供与 frontier model 相当的智能水平的同时,每个任务轨迹的 token 消耗减少了 40% 到 60%。
Reasoning 延迟: 深度思考模式可能会导致在 model 开始生成文本之前出现几分钟的延迟。
长周期连贯性: 在 100 万 tokens 的 context window 和超过 1,000 次工具调用的序列中保持了良好的 reasoning 准确性。
平台访问复杂: 官方 Web 门户的登录过程不稳定,用户常反馈难以操作。
软件工程性能: 在 SWE-bench Verified 上达到了 78.9% 的分数,表明在解决 GitHub 级代码问题方面具有极高的能力。
安全拒绝模式: 在漫长的思考周期末尾偶尔会出现拒绝响应,这消耗了计算时间却未提供输出。
宽松的 MIT 许可: 允许商业集成和权重修改,没有其他 open-source 许可中常见的限制性条款。
高昂的硬件要求: 本地部署 1.02T parameters 的 model 需要多 GPU 集群,使得小型团队的自托管成本高昂。

API快速入门

xiaomi/mimo-v2.5-pro

查看文档
other SDK
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Identify logic errors in this 50,000 line codebase." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

安装SDK并在几分钟内开始进行API调用。

人们对 MiMo V2.5 Pro 的评价

看看社区对 MiMo V2.5 Pro 的看法

对于需要一次性扫描整个代码库的 RAG 流水线,MiMo-V2.5-Pro 的速度与 context 比率是无敌的。
u/DevBuilder
reddit
中国刚刚以 40-60% 的 token 成本匹配了美国的 frontier coding AI。这不仅仅是增量改进;这是在重写规则。
Shruti
twitter
MiMo-V2.5-Pro 解决了原本需要人类专家花费数周才能解决的问题。它仅用了 4 小时多一点就构建了一个完整的编译器。
TechCrunchy
twitter
该 model 的价值不仅在于 benchmark,还在于它能够持续执行复杂的 agent 工作流而不崩溃。
XiaomiMiMo Team
hackernews
对于一个 1T 的 model 来说,速度确实不错。MoE 路由在这里发挥了很大作用。
AIExplorer
reddit
终于有一款 MIT 许可的 model 可以真正与 closed-source 巨头竞争了。本地部署是下一个挑战。
OpenSourceFan
twitter

关于 MiMo V2.5 Pro 的视频

观看关于 MiMo V2.5 Pro 的教程、评测和讨论

我从未在结果中见过这种细节水平……看看那木板地板的细节。

当你提供特定的技术错误消息时,该 model 非常自信且有效。

它处理整个代码库 context 时,不会出现通常的文档中间信息丢失。

思考过程是透明的,确切展示了它如何评估各种工具选项。

该 model 在 JSON 输出的严格指令遵循方面表现优于其前身。

它旨在处理复杂的多步工作流,支持数千次工具调用。

在相似的性能下,它比 GPT-5.4 或 Claude Opus 4.6 等 model 少用了 40% 到 60% 的 tokens。

小米凭借此次发布震撼了 open-source AI 领域。

原生的多模态特性意味着它不需要单独的视频 vision encoder。

通过提供正确的环境钩子(hooks),你可以有效地构建整个 OS 组件。

Mimo 的定价意在压制所有人……编码计划的第一个月仅需 6 美元。

Benchmark 只能说明部分情况;我希望它们是真正的构建者,能把屋顶修好。

在处理长 reasoning 链时,它比早期的 V2 版本稳定得多。

其原生 API 的定价非常激进,很可能是为了抢占开发者市场。

它在处理极高频音频时稍显吃力,但在处理对话语音时完美无缺。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

MiMo V2.5 Pro专业提示

专家提示助您充分利用MiMo V2.5 Pro。

管理 chain-of-thought 延迟

在 prompt 中加入“不要过度思考(don't overthink)”,以减少简单技术查询的 reasoning 延迟。

保留 reasoning 内容

在多轮对话中传回之前的 reasoning_content,以保持 agentic 性能。

定义环境功能(Affordances)

清晰地指定工具环境的能力,因为该 model 针对环境感知(harness awareness)进行了优化。

优化本地部署

使用 FP8 混合精度权重,以平衡内存效率和高输出 throughput。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M

关于MiMo V2.5 Pro的常见问题

查找关于MiMo V2.5 Pro的常见问题答案