other

MiMo V2.5 Pro

MiMo V2.5 Proは、1M context window、ネイティブなmultimodal機能、そしてエリートレベルのagenticなコーディングパフォーマンスを備えた、Xiaomiのopen-source 1.02T parameters MoE modelです。

Open-sourceAgentic AIMultimodal1M ContextXiaomi
other logootherMiMo2026年4月27日
コンテキスト
1.0Mトークン
最大出力
131Kトークン
入力価格
$1.00/ 1M
出力価格
$3.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
54%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 MiMo V2.5 Proはこのベンチマークで54%を記録しました。
HLE
48%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 MiMo V2.5 Proはこのベンチマークで48%を記録しました。
MMLU
86.7%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 MiMo V2.5 Proはこのベンチマークで86.7%を記録しました。
MMLU Pro
84.9%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 MiMo V2.5 Proはこのベンチマークで84.9%を記録しました。
SimpleQA
45%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 MiMo V2.5 Proはこのベンチマークで45%を記録しました。
IFEval
88%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 MiMo V2.5 Proはこのベンチマークで88%を記録しました。
AIME 2025
41%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 MiMo V2.5 Proはこのベンチマークで41%を記録しました。
MATH
75%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 MiMo V2.5 Proはこのベンチマークで75%を記録しました。
GSM8k
95.5%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 MiMo V2.5 Proはこのベンチマークで95.5%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 MiMo V2.5 Proはこのベンチマークで92%を記録しました。
MathVista
65%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 MiMo V2.5 Proはこのベンチマークで65%を記録しました。
SWE-Bench
78.9%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 MiMo V2.5 Proはこのベンチマークで78.9%を記録しました。
HumanEval
90%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 MiMo V2.5 Proはこのベンチマークで90%を記録しました。
LiveCodeBench
80.6%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 MiMo V2.5 Proはこのベンチマークで80.6%を記録しました。
MMMU
73%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 MiMo V2.5 Proはこのベンチマークで73%を記録しました。
MMMU Pro
52%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 MiMo V2.5 Proはこのベンチマークで52%を記録しました。
ChartQA
89%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 MiMo V2.5 Proはこのベンチマークで89%を記録しました。
DocVQA
93.5%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 MiMo V2.5 Proはこのベンチマークで93.5%を記録しました。
Terminal-Bench
68.4%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 MiMo V2.5 Proはこのベンチマークで68.4%を記録しました。
ARC-AGI
8%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 MiMo V2.5 Proはこのベンチマークで8%を記録しました。

MiMo V2.5 Proについて

MiMo V2.5 Proの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

MiMo V2.5 Proは、Xiaomiのフラッグシップopen-source modelです。1.02兆のparametersを持つMoEアーキテクチャを採用しており、inference時には420億のparametersがアクティブになります。ハイブリッドアテンション設計により、Local Sliding Window AttentionとGlobal Attentionを6:1の比率で混合。この特殊な構成により、標準的なtransformer modelと比較してKV-cacheのストレージ要件を約7倍削減しています。

このmodelは100万tokensのcontext windowに対応し、テキスト、画像、音声、ビデオを含むネイティブなomnimodal入力をサポートしています。長期間のagenticなタスクや自律的なツール使用に最適化されています。開発者はFP8精度の重みを使用してローカル環境でmodelを動かすことができ、メモリ使用量と出力throughputのバランスを調整可能です。MITライセンスのため、追加費用なしで改変や商用デプロイが可能です。

MiMo V2.5 Pro

MiMo V2.5 Proのユースケース

MiMo V2.5 Proを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なソフトウェアエンジニアリング

GitHubのissue解決や、自己修正ロジックを持つコンパイラなどのシステムコンポーネントの構築。

長期的なagentワークフロー

ソフトウェア環境において1,000回以上のツール呼び出しにわたる一貫性が求められる計画の実行。

ネイティブなmultimodal解析

外部での前処理やフレーム抽出を介さず、ビデオとテキストの結合入力を直接推論。

大規模なコードベースのナビゲーション

1M tokensのcontext window内にリポジトリ全体を取り込み、ロジックのリファクタリングやバグ修正を行う。

アナログ回路設計

シミュレーションループと対話しながら複雑な回路を最適化し、複数指標の仕様を満たす。

3D Web生成

Three.jsと手続き型地形生成を用いて、洗練された環境や物理シミュレーションを作成。

強み

制限

低tokens消費量: タスクのトラジェクトリあたりのtokensを40%〜60%節約しながら、frontier modelと同等のインテリジェンスを提供。
推論のlatency: deep thinkingモードでは、modelがテキスト生成を開始するまでに数分の遅延が発生する可能性がある。
長期的な一貫性: 100万tokensのcontext windowと1,000回を超えるツール呼び出しのシーケンス全体で推論精度を維持。
プラットフォームアクセスの複雑さ: 公式のWebポータルはサインインプロセスが不安定で、ユーザーからは操作が難しいと頻繁に報告されている。
ソフトウェアエンジニアリングのパフォーマンス: SWE-bench Verifiedで78.9%のスコアを達成し、GitHubレベルのコード問題を解決する高い能力を実証。
安全性の拒否パターン: 長い推論サイクルの最後で拒否が発生することがあり、出力が得られずにコンピューティング時間を消費してしまう。
寛容なMITライセンス: 他のopen-sourceライセンスに見られる制限的な条項がなく、商用統合や重みの変更が可能。
大幅なハードウェア要件: 1.02Tのparametersを持つmodelのローカルホストにはマルチGPUクラスターが必要で、小規模チームにはコスト負担が大きい。

APIクイックスタート

xiaomi/mimo-v2.5-pro

ドキュメントを見る
other SDK
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "5万行のコードベースに含まれるロジックエラーを特定してください。" }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

SDKをインストールして、数分でAPIコールを開始しましょう。

MiMo V2.5 Proについてのユーザーの声

MiMo V2.5 Proについてコミュニティがどう思っているか見てください

MiMo-V2.5-Proの速度とcontextの比率は、一度にコードベース全体をスキャンする必要があるRAGパイプラインにとって最強だ。
u/DevBuilder
reddit
中国がついに米国のFrontier AIと肩を並べ、tokensコストを40〜60%引き下げた。これは漸進的な変化ではなく、ゲームの書き換えだ。
Shruti
twitter
MiMo-V2.5-Proは人間の専門家なら数週間かかる問題を解決した。たった4時間強で完全なコンパイラを構築したんだ。
TechCrunchy
twitter
このmodelの価値はベンチマークだけでなく、複雑なagentワークフローを中断させずに維持できる能力にある。
XiaomiMiMo Team
hackernews
1Tのmodelにしては速度はかなりまともだ。MoEのルーティングがかなりうまく機能している。
AIExplorer
reddit
ついにクローズドな巨人たちと張り合えるMITライセンスのmodelが登場した。ローカルデプロイが次のハードルだな。
OpenSourceFan
twitter

MiMo V2.5 Proについての動画

MiMo V2.5 Proについてのチュートリアル、レビュー、ディスカッションを見る

これほど詳細な結果を見たことがない…フローリングの木のパネル一つ一つを見てほしい。

特定の技術的なエラーメッセージを入力すると、modelは非常に自信を持って効果的に対応する。

文書の途中で内容が失われることなく、コードベース全体のcontextを処理できる。

思考プロセスが透明化されており、様々なツールオプションをどう評価しているかが正確にわかる。

このmodelは、JSON出力の指示に従う精度において、先行するmodelを凌駕している。

複雑なステップのワークフローを処理するように設計されており、数千のツール呼び出しを維持できる。

GPT-5.4やClaude Opus 4.6と同等のパフォーマンスで、tokensを40〜60%少なく消費する。

Xiaomiはこのリリースでopen-source AI界を震撼させた。

ネイティブなmultimodalityのおかげで、ビデオに対して個別のVision Encoderを必要としない。

適切な環境フックを提供すれば、OSのコンポーネント全体を効率的に構築できる。

Mimoは他を出し抜くために出てきた…コーディングプランの最初の月はたったの6ドルだ。

ベンチマークは一面を語るに過ぎない。実際に構築を行い、正しく屋根を設置できる能力を求めている。

長い推論チェーンを処理する際の安定性は、初期のV2リリースよりもはるかに高い。

ネイティブAPIの価格設定は攻撃的で、おそらく開発者市場を狙っているのだろう。

非常に高い周波数の音声には若干苦労するが、会話の音声は完璧に処理できる。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

MiMo V2.5 Proのプロのヒント

MiMo V2.5 Proを最大限に活用し、より良い結果を得るための専門家のヒント。

chain-of-thoughtのlatency管理

シンプルな技術的質問に対しては、promptに「考えすぎないで(don't overthink)」と加えることで、推論のlatencyを短縮できます。

推論コンテンツの保持

agenticなパフォーマンスを維持するため、マルチターンの会話では前のreasoning_contentを渡すようにしてください。

環境の制約を定義

modelがharnessの認識に最適化されているため、ツールの環境能力を明確に指定してください。

ローカルデプロイの最適化

メモリ効率と高い出力throughputのバランスを取るために、FP8の混合精度重みを使用してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M

MiMo V2.5 Proについてのよくある質問

MiMo V2.5 Proに関するよくある質問への回答を見つけてください