minimax

MiniMax M2.5

MiniMax M2.5は、1M context windowとエリートレベルのagentic coding能力を備えた最先端のMoE modelです。自律型エージェントに破壊的な価格設定を提供します。

Agentic AIMoE ArchitectureCoding SpecialistCost Efficient
minimax logominimaxMiniMax M-SeriesFebruary 12, 2026
コンテキスト
1.0Mトークン
最大出力
128Kトークン
入力価格
$0.30/ 1M
出力価格
$1.20/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
62%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 MiniMax M2.5はこのベンチマークで62%を記録しました。
HLE
28%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 MiniMax M2.5はこのベンチマークで28%を記録しました。
MMLU
85%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 MiniMax M2.5はこのベンチマークで85%を記録しました。
MMLU Pro
76.5%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 MiniMax M2.5はこのベンチマークで76.5%を記録しました。
SimpleQA
44%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 MiniMax M2.5はこのベンチマークで44%を記録しました。
IFEval
87.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 MiniMax M2.5はこのベンチマークで87.5%を記録しました。
AIME 2025
45%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 MiniMax M2.5はこのベンチマークで45%を記録しました。
MATH
72%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 MiniMax M2.5はこのベンチマークで72%を記録しました。
GSM8k
95.8%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 MiniMax M2.5はこのベンチマークで95.8%を記録しました。
MGSM
92.4%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 MiniMax M2.5はこのベンチマークで92.4%を記録しました。
MathVista
65%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 MiniMax M2.5はこのベンチマークで65%を記録しました。
SWE-Bench
80.2%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 MiniMax M2.5はこのベンチマークで80.2%を記録しました。
HumanEval
89.6%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 MiniMax M2.5はこのベンチマークで89.6%を記録しました。
LiveCodeBench
65%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 MiniMax M2.5はこのベンチマークで65%を記録しました。
MMMU
68%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 MiniMax M2.5はこのベンチマークで68%を記録しました。
MMMU Pro
54%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 MiniMax M2.5はこのベンチマークで54%を記録しました。
ChartQA
88%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 MiniMax M2.5はこのベンチマークで88%を記録しました。
DocVQA
93.2%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 MiniMax M2.5はこのベンチマークで93.2%を記録しました。
Terminal-Bench
52%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 MiniMax M2.5はこのベンチマークで52%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 MiniMax M2.5はこのベンチマークで12%を記録しました。

MiniMax M2.5について

MiniMax M2.5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

高効率なFrontier知能

MiniMax M2.5は、frontier modelクラスのAIの効率性における大きなブレークスルーを象徴しています。MoE(Mixture-of-Experts)modelとして、総計2,300億parametersのスパースアーキテクチャを採用していますが、1tokenあたりにアクティブになるのは100億parametersのみです。この設計により、世界のflagship modelに匹敵する性能を維持しつつ、大幅に高速で安価な運用を可能にしています。2026年初頭にリリースされたこのモデルは、AIがマルチステップのタスクにわたって計画、実行、自己修正を行う「agentic」なワークロードに特化して最適化されています。

アーキテクチャ思考によるreasoningとコーディング

M2.5の最も際立った特徴の一つは、創発的なアーキテクチャ思考です。コードを直線的に生成する標準的なLLMとは異なり、M2.5はファイルを書き始める前にプロジェクトの階層構造や論理構造をマッピングするように学習されています。この能力と100万tokenのcontext windowを組み合わせることで、自律的なソフトウェアエンジニアリング、大規模なコードレビュー、複雑なリポジトリ管理における最優先の選択肢となります。10以上のプログラミング言語をサポートし、最大100 tokens per secondのネイティブスループットを特徴としています。

MiniMax M2.5

MiniMax M2.5のユースケース

MiniMax M2.5を使って素晴らしい結果を得るさまざまな方法を発見してください。

Agenticなソフトウェアエンジニアリング

Architect modeを使用し、サンドボックス環境内でのマルチファイルプロジェクトの自律的な生成とテスト。

高精度なオフィスオートメーション

専門的な財務モデリングを含む、Word、PowerPoint、Excelにわたる複雑なタスクの実行。

自律的なWebリサーチ

情報密度の高いウェブページをナビゲートし、専門家レベルの情報収集と統合を実行。

バイリンガルなテクニカルサポート

複雑なデバッグやアーキテクチャ設計において、中国語と英語の両方でネイティブレベルの流暢さを提供。

3Dシミュレーションのプロトタイピング

Three.jsのような機能的な3D環境やインタラクティブなコンポーネントをワンショットで生成。

エンタープライズ向けのコードレビュー

アーキテクチャの監視を伴う、10以上のプログラミング言語にわたる包括的なコードレビューとシステムテスト。

強み

制限

破壊的なコスト効率: 1M tokensあたり0.30ドル/1.20ドルという価格で、世界の競合他社の数分の一のコストでエリート級の知能を提供します。
時折発生するロジックエラー: 初回の「ワンショット」コードにおいて、複雑なアニメーションの論理的な不整合などの機能的エラーが含まれることがあります。
アーキテクチャの計画能力: codeを生成する前に、プロジェクトの階層構造や論理構造をマッピングする独自の能力を備えています。
地理的なレイテンシ: アジア太平洋地域以外を拠点とするユーザーは、ローカルのエッジデプロイメントセンターがない場合、latencyが大きくなる可能性があります。
極めて高いinference速度: 100 TPSのネイティブ提供により、インタラクティブなワークフローにおいて最速のfrontier modelの一つとなっています。
世界知識のギャップ: 技術的には正確ですが、3D生成においてニッチな実在のオブジェクトへの正確なアライメントに苦戦することがあります。
エリートレベルのcoding性能: 実際のソフトウェアエンジニアリングに特化して最適化されており、SWE-Bench Verifiedで80.2%を達成しています。
指示への感度: 非常に具体的にpromptを与えない限り、複雑なタスクにおいて「シングルスクリプト」の制約を無視し、マルチファイル構成にしてしまうことがあります。

APIクイックスタート

minimax/minimax-m2.5

ドキュメントを見る
minimax SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: "https://api.minimax.chat/v1",
});

async function main() {
  const response = await client.chat.completions.create({
    model: "minimax-m2.5",
    messages: [{ role: "user", content: "Plan like an architect and code a 3D Formula 1 car drifting." }],
  });
  console.log(response.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

MiniMax M2.5についてのユーザーの声

MiniMax M2.5についてコミュニティがどう思っているか見てください

"MiniMax M2.5は、より高速で圧倒的に安価なトップティアのコーディングおよびagentic modelだ。"
WorldofAI
youtube
"M2.5の速度はエージェントループ内で大きな効果を発揮する。常時稼働の商用ワークロード向けに構築されている。"
MarketingNetMind
reddit
"遅いボットというより、疲れを知らない助っ人のように感じる。このスピードは私の環境において真のゲームチェンジャーだ。"
bruckout
reddit
"これは本物のゲームチェンジャーに見える。コストは商用のflagship modelの10分の1だ。"
Techmeme
facebook
"SWE Bench Verifiedで80.2%に達している。これはエージェントの経済性における桁違いのシフトだ。"
jackhnels
x
"アーキテクチャ計画モードのおかげで、自律的なコーディングエージェントがついに開発チームにとって信頼に足るものになった。"
logic_pro
hackernews

MiniMax M2.5についての動画

MiniMax M2.5についてのチュートリアル、レビュー、ディスカッションを見る

「ついに『知能が安すぎて計量不能』という概念が真に現実味を帯びてきた。」

「品質は間違いなく本物だ。複雑なフロントエンドのアニメーションでさえ驚くほど機能する。」

「このmodelは今、codingのbenchmarkを完全に圧倒している。」

「エージェントループ中における自己修正能力こそが、M2.1と一線を画す点だ。」

「今年の他のリリースの中で、これほどの費用対効果は見たことがない。」

「以前の世代からの重要な改善点は、M2.5がアーキテクトのように思考し、計画を立てる能力だ。」

「これは非常に強力なagenticなコーディングツールとして台頭してくるだろう。」

「実際のReactコンポーネントを書く前に、フォルダ構造をどのように分解しているかに注目してほしい。」

「ここでのreasoning能力は、アクティブなparameter数以上の実力を発揮している。」

「自律的な開発エージェントを構築しているなら、今すぐこのmodelをテストすべきだ。」

「自分のワークフローにこれを導入すれば、コーディングにおいてかなり良い結果が得られるだろう。」

「彼らは決して後れを取っていない。総合的なパフォーマンスの面で着実に差を縮めている。」

「multimodalなvisionサポートは、一部の商用modelよりも複雑なUIワイヤーフレームをうまく処理できる。」

「エージェントにとって、速度が純粋な知能と同じくらい重要になるという傾向が見て取れる。」

「M2.5は、グローバルな開発者にとってのMiniMaxエコシステムの成熟を象徴している。」

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

MiniMax M2.5のプロのヒント

MiniMax M2.5を最大限に活用し、より良い結果を得るための専門家のヒント。

Architect Modeを活用する

modelに対して「アーキテクトのように計画して」と明示的にpromptを与えることで、より深いreasoningとファイル構造の分解をトリガーできます。

反復的なフィードバックの利用

複雑な3DやSVGアニメーションの場合、機能エラーに対するフィードバックを提供することで、modelのagenticな自己修正能力を引き出すことができます。

Prompt Cachingの管理

大規模なドキュメントセットをキャッシュすることで、1Mのcontext windowを有効活用し、コストを最大90%削減できます。

Lightningバージョンの切り替え

リアルタイムでインタラクティブなUIコーディングを行う場合は、100 TPSの速度を実現するLightningバージョンを使用してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
other

PixVerse-R1

Other

PixVerse-R1 is a next-gen real-time world model by AIsphere, offering interactive 1080p video generation with instant response and physics-aware continuity.

MiniMax M2.5についてのよくある質問

MiniMax M2.5に関するよくある質問への回答を見つけてください