Quelle est la tarification de MiMo V2.5 Pro ?

La tarification est de 1,00 $ pour 1 million de tokens en entrée et 3,00 $ pour 1 million de tokens en sortie sur la plateforme officielle. Cette structure est nettement plus abordable que celle des modèles fermés comme GPT-5.4 pour les tâches de génération.

Comment accéder à l'API de MiMo V2.5 Pro ?

L'accès est fourni via la plateforme API ouverte de Xiaomi MiMo, avec des en-têtes compatibles avec l'OpenAI SDK. Il est également disponible via des agrégateurs tiers tels qu'OpenRouter.

Quelle est la taille de la context window ?

Le modèle prend en charge une context window de 1 048 576 tokens. Cela permet aux utilisateurs d'intégrer des bibliothèques entières ou plusieurs heures de contenu vidéo dans un seul prompt.

Comment se compare-t-il aux frontier models fermés ?

Il égale ou surpasse des modèles comme Claude Opus 4.6 sur SWE-Bench Verified et pour les tâches agentic. Il a atteint ces résultats tout en consommant environ 40 % de tokens en moins par trajectoire.

Prend-il en charge l'entrée multimodale native ?

Oui, c'est un agent omnimodal natif qui accepte des entrées texte, image, audio et vidéo. Il effectue son reasoning sur ces types de données directement sans nécessiter de prétraitement externe.

Quelle est la licence du modèle ?

MiMo V2.5 Pro est publié sous licence MIT. Cela autorise une utilisation commerciale, une modification et une redistribution sans restriction.

Puis-je utiliser le function calling ?

Oui, il prend en charge le function calling de manière fiable et est optimisé pour l'utilisation d'outils multi-tours. Il maintient sa cohérence sur des séquences dépassant 1 000 appels d'outils dans des environnements logiciels.

Quel matériel est nécessaire pour un hébergement local ?

L'hébergement local nécessite du matériel de classe entreprise en raison du nombre de paramètres de 1,02T. Les développeurs doivent utiliser des clusters multi-GPU et des poids en précision FP8 pour plus d'efficacité.

MiMo V2.5 Pro

MiMo V2.5 Pro est le modèle MoE open-source de 1,02T paramètres de Xiaomi, doté d'une context window de 1M, d'une multimodalité native et de performances de...

Open SourceAgentic AIMultimodalContexte 1MXiaomi

otherMiMo27 avril 2026

Contexte

1.0Mtokens

Sortie max.

131Ktokens

Prix entrée

$1.00/ 1M

Prix sortie

$3.00/ 1M

Modalité:TextImageAudioVideo

Capacités:VisionOutilsStreamingRaisonnement

Benchmarks

GPQA

54%

HLE

48%

MMLU

86.7%

MMLU Pro

84.9%

SimpleQA

45%

IFEval

88%

AIME 2025

41%

MATH

75%

GSM8k

95.5%

MGSM

92%

MathVista

65%

SWE-Bench

78.9%

HumanEval

90%

LiveCodeBench

80.6%

MMMU

73%

MMMU Pro

52%

ChartQA

89%

DocVQA

93.5%

Terminal-Bench

68.4%

ARC-AGI

Voir la documentation API

À propos de MiMo V2.5 Pro

Découvrez les capacités, fonctionnalités et façons d'utiliser MiMo V2.5 Pro.

MiMo V2.5 Pro est le modèle open-source flagship de Xiaomi. Il utilise une architecture Mixture-of-Experts de 1,02 trillion de paramètres, dont 42 milliards sont actifs pendant l'inference. La conception hybride-attention mélange Local Sliding Window Attention et Global Attention dans un ratio de 6:1. Cette configuration spécifique réduit les besoins de stockage en KV-cache de près de 7x par rapport aux modèles transformer standard.

Le modèle gère une context window de 1 million de tokens tout en prenant en charge des entrées omnimodales natives, incluant texte, image, audio et vidéo. Il est optimisé pour les tâches agentic à long terme et l'utilisation d'outils autonomes. Les développeurs peuvent exécuter le modèle localement en utilisant des poids en précision FP8, qui équilibrent l'usage de la mémoire avec le throughput de sortie. La licence MIT permissive autorise la modification et le déploiement commercial sans frais supplémentaires.

Cas d'utilisation de MiMo V2.5 Pro

Découvrez les différentes façons d'utiliser MiMo V2.5 Pro pour obtenir d'excellents résultats.

Génie logiciel autonome

Résolution de problèmes GitHub et construction de composants système comme des compilateurs avec une logique d'auto-correction.

Workflows d'agents à long terme

Exécution de plans nécessitant une cohérence sur plus de 1 000 appels d'outils dans des environnements logiciels.

Analyse multimodale native

Reasoning direct sur des entrées combinées de vidéo et de texte sans prétraitement externe ou extraction d'images.

Navigation dans des bases de code à grande échelle

Ingestion de dépôts de projets entiers au sein de la context window de 1M de tokens pour refactoriser la logique ou trouver des bugs.

Conception de circuits analogiques

Optimisation de circuits complexes en interagissant avec des boucles de simulation pour respecter des spécifications multi-métriques.

Génération Web 3D

Création d'environnements sophistiqués et de simulations physiques en utilisant Three.js et la génération procédurale de terrain.

Points forts

Limitations

Faible consommation de tokens: Offre une intelligence équivalente aux frontier models tout en utilisant 40 % à 60 % de tokens en moins par trajectoire de tâche.

Latence de reasoning: Le mode de réflexion approfondie peut entraîner des délais de plusieurs minutes avant que le modèle ne commence à générer du texte.

Cohérence à long terme: Maintient une précision de reasoning sur des context windows de 1 million de tokens et des séquences de plus de 1 000 appels d'outils.

Accès complexe à la plateforme: Le portail web officiel possède un processus de connexion instable que les utilisateurs décrivent fréquemment comme difficile à naviguer.

Performance en génie logiciel: Atteint un score de 78,9 % sur SWE-bench Verified, indiquant une grande maîtrise dans la résolution de problèmes de code au niveau GitHub.

Modèles de refus de sécurité: Des refus occasionnels peuvent survenir à la toute fin de longs cycles de réflexion, ce qui consomme du temps de calcul sans fournir de résultat.

Licence MIT permissive: Autorise l'intégration commerciale et la modification des poids sans les conditions restrictives présentes dans d'autres licences open-source.

Exigences matérielles significatives: L'hébergement local du modèle à 1,02T paramètres nécessite des clusters multi-GPU, rendant l'auto-hébergement coûteux pour les petites équipes.

Démarrage rapide API

xiaomi/mimo-v2.5-pro

Voir la documentation

other SDK

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Identifie les erreurs de logique dans cette base de code de 50 000 lignes." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de MiMo V2.5 Pro

Voyez ce que la communauté pense de MiMo V2.5 Pro

“Le ratio vitesse-contexte sur MiMo-V2.5-Pro est imbattable pour les pipelines RAG qui ont besoin de scanner des bases de code entières en une seule fois.”

— u/DevBuilder

“La Chine vient d'égaler l'IA de codage de frontier USA avec un coût en tokens inférieur de 40 à 60 %. Ce n'est pas incrémental ; cela change la donne.”

— Shruti

twitter

“MiMo-V2.5-Pro a résolu des problèmes qui auraient pris des semaines à des experts humains. Il a construit un compilateur complet en un peu plus de 4 heures.”

— TechCrunchy

twitter

“La valeur du modèle ne réside pas seulement dans les benchmarks, mais dans sa capacité à maintenir des workflows d'agents complexes sans faillir.”

— XiaomiMiMo Team

hackernews

“La vitesse est en fait décente pour un modèle 1T. Le routage MoE fait un travail énorme ici.”

— AIExplorer

“Enfin un modèle sous licence MIT qui rivalise réellement avec les géants fermés. Le déploiement local est le prochain obstacle.”

— OpenSourceFan

twitter

Vidéos sur MiMo V2.5 Pro

Regardez des tutoriels, critiques et discussions sur MiMo V2.5 Pro

“Je n'ai jamais vu un tel niveau de détail dans un résultat... regardez le parquet individuel.”

“Le modèle est très confiant et efficace lorsque vous lui fournissez des messages d'erreur techniques spécifiques.”

“Il gère tout le contexte de la base de code sans la perte habituelle au milieu du document.”

“Le processus de réflexion est transparent, montrant exactement comment il évalue les différentes options d'outils.”

“Ce modèle surpasse ses prédécesseurs dans le suivi strict des instructions pour les sorties JSON.”

“Il est conçu pour gérer des workflows complexes en plusieurs étapes, en soutenant des milliers d'appels d'outils.”

“Il utilise 40 à 60 % de tokens en moins que des modèles comme GPT-5.4 ou Claude Opus 4.6 à performance similaire.”

“Xiaomi vient de choquer l'espace AI open-source avec cette sortie.”

“La multimodalité native signifie qu'il n'a pas besoin d'un encodeur de vision séparé pour la vidéo.”

“Vous pouvez effectivement construire un composant OS entier en fournissant les bons hooks d'environnement.”

“Mimo est arrivé pour casser les prix... le premier mois du plan de codage ne coûte que six dollars.”

“Les benchmarks ne racontent qu'une partie de l'histoire ; je veux qu'ils soient de vrais bâtisseurs et qu'ils posent le toit correctement.”

“Il est beaucoup plus stable que la version V2 précédente lors de la gestion de longues chaînes de reasoning.”

“La tarification de leur API native est agressive, probablement pour capturer le marché des développeurs.”

“Il peine légèrement avec l'audio à très haute fréquence, mais gère parfaitement la parole conversationnelle.”

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA

Automatisation Web

Flux Intelligents

Commencer Gratuitement

Conseils Pro pour MiMo V2.5 Pro

Conseils d'experts pour tirer le meilleur parti de MiMo V2.5 Pro.

Gérer la latence du chain-of-thought

Ajoutez « don't overthink » (ne réfléchis pas trop) à votre prompt pour réduire la latence de reasoning lors de requêtes techniques simples.

Préserver le contenu de reasoning

Renvoyez le reasoning_content précédent dans les conversations multi-tours pour maintenir les performances de l'agent.

Définir les affordances de l'environnement

Spécifiez clairement les capacités de l'environnement d'outils, car le modèle est optimisé pour la connaissance du cadre d'exécution.

Optimiser le déploiement local

Utilisez des poids en précision mixte FP8 pour équilibrer l'efficacité de la mémoire et un throughput de sortie élevé.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context

$0.28/$0.42/1M

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context

$0.15/$1.20/1M

Gemini 3.6 Flash

Google

Gemini 3.6 Flash is Google's high-speed model featuring a 17% reduction in token consumption, $1.50/M input pricing, and advanced 3D visualization.

1M context

$1.50/$7.50/1M

Kimi K2.7 Code

Moonshot

Kimi K2.7 Code is a 1T parameter MoE model from Moonshot AI. It features a 262k context window and 30% more efficient reasoning for software engineering.

262K context

$0.95/$4.00/1M

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context

$0.60/$2.20/1M

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context

$0.12/$0.75/1M

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context

$0.15/$0.60/1M

Gemini 3.6 Flash Lite

Google

Gemini 3.6 Flash Lite is a high-efficiency model from Google featuring a 1M token context window and 350 tokens/sec throughput for agentic workflows.

1M context

$0.30/$2.50/1M

Questions Fréquentes sur MiMo V2.5 Pro

Trouvez des réponses aux questions courantes sur MiMo V2.5 Pro