other

MiMo V2.5 Pro

MiMo V2.5 Pro es el model open-source de 1,02T de parámetros MoE de Xiaomi, con una context window de 1M, multimodalidad nativa y un rendimiento de...

Open SourceAgentic AIMultimodal1M ContextXiaomi
other logootherMiMo27 de abril de 2026
Contexto
1.0Mtokens
Salida máx.
131Ktokens
Precio entrada
$1.00/ 1M
Precio salida
$3.00/ 1M
Modalidad:TextImageAudioVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
54%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). MiMo V2.5 Pro obtuvo 54% en este benchmark.
HLE
48%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. MiMo V2.5 Pro obtuvo 48% en este benchmark.
MMLU
86.7%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. MiMo V2.5 Pro obtuvo 86.7% en este benchmark.
MMLU Pro
84.9%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. MiMo V2.5 Pro obtuvo 84.9% en este benchmark.
SimpleQA
45%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. MiMo V2.5 Pro obtuvo 45% en este benchmark.
IFEval
88%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. MiMo V2.5 Pro obtuvo 88% en este benchmark.
AIME 2025
41%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. MiMo V2.5 Pro obtuvo 41% en este benchmark.
MATH
75%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. MiMo V2.5 Pro obtuvo 75% en este benchmark.
GSM8k
95.5%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. MiMo V2.5 Pro obtuvo 95.5% en este benchmark.
MGSM
92%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. MiMo V2.5 Pro obtuvo 92% en este benchmark.
MathVista
65%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. MiMo V2.5 Pro obtuvo 65% en este benchmark.
SWE-Bench
78.9%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). MiMo V2.5 Pro obtuvo 78.9% en este benchmark.
HumanEval
90%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. MiMo V2.5 Pro obtuvo 90% en este benchmark.
LiveCodeBench
80.6%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. MiMo V2.5 Pro obtuvo 80.6% en este benchmark.
MMMU
73%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. MiMo V2.5 Pro obtuvo 73% en este benchmark.
MMMU Pro
52%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. MiMo V2.5 Pro obtuvo 52% en este benchmark.
ChartQA
89%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. MiMo V2.5 Pro obtuvo 89% en este benchmark.
DocVQA
93.5%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. MiMo V2.5 Pro obtuvo 93.5% en este benchmark.
Terminal-Bench
68.4%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. MiMo V2.5 Pro obtuvo 68.4% en este benchmark.
ARC-AGI
8%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. MiMo V2.5 Pro obtuvo 8% en este benchmark.

Acerca de MiMo V2.5 Pro

Conoce las capacidades, características y formas de uso de MiMo V2.5 Pro.

MiMo V2.5 Pro es el flagship model open-source de Xiaomi. Utiliza una arquitectura de Mixture-of-Experts de 1,02 billones de parámetros, donde 42 mil millones de parámetros están activos durante la inference. El diseño de atención híbrida combina la atención de ventana deslizante local (Local Sliding Window Attention) y la atención global en una proporción de 6:1. Esta configuración específica reduce los requisitos de almacenamiento de KV-cache casi 7 veces en comparación con los modelos transformer estándar.

El model maneja una context window de 1 millón de tokens mientras admite entradas omnimodales nativas que incluyen texto, imagen, audio y video. Está optimizado para tareas agentic de largo horizonte y uso autónomo de herramientas. Los desarrolladores pueden ejecutar el model localmente utilizando pesos de precisión FP8, que equilibran el uso de memoria con el throughput de salida. La licencia MIT permisiva permite la modificación y el despliegue comercial sin tarifas adicionales.

MiMo V2.5 Pro

Casos de uso de MiMo V2.5 Pro

Descubre las diferentes formas de usar MiMo V2.5 Pro para lograr excelentes resultados.

Ingeniería de software autónoma

Resolución de problemas en GitHub y creación de componentes del sistema, como compiladores, con lógica de autocorrección.

Flujos de trabajo de agente de largo horizonte

Ejecución de planes que requieren coherencia a lo largo de más de 1.000 llamadas a herramientas en entornos de software.

Análisis multimodal nativo

Razonamiento directo sobre entradas combinadas de video y texto sin necesidad de preprocesamiento externo o extracción de fotogramas.

Navegación de bases de código a gran escala

Ingesta de repositorios completos de proyectos dentro de la context window de 1M de tokens para refactorizar lógica o encontrar errores.

Diseño de circuitos analógicos

Optimización de circuitos complejos mediante la interacción con bucles de simulación para cumplir especificaciones de múltiples métricas.

Generación web 3D

Creación de entornos sofisticados y simulaciones físicas utilizando Three.js y generación procedimental de terreno.

Fortalezas

Limitaciones

Bajo consumo de tokens: Ofrece una inteligencia igual a la de los frontier models mientras utiliza entre un 40% y un 60% menos de tokens por trayectoria de tarea.
Latency de reasoning: El modo de pensamiento profundo puede provocar retrasos de varios minutos antes de que el model comience a generar texto.
Coherencia de largo horizonte: Mantiene la precisión en el reasoning a través de context windows de 1 millón de tokens y secuencias de más de 1.000 llamadas a herramientas.
Acceso complejo a la plataforma: El portal web oficial tiene un proceso de inicio de sesión inestable que los usuarios suelen describir como difícil de navegar.
Rendimiento en ingeniería de software: Alcanza una puntuación del 78,9% en SWE-bench Verified, lo que indica una alta competencia en la resolución de problemas de código de nivel GitHub.
Patrones de rechazo por seguridad: Pueden ocurrir rechazos ocasionales al final de ciclos largos de pensamiento, lo que consume tiempo de cómputo sin proporcionar una salida.
Licencia MIT permisiva: Permite la integración comercial y la modificación de pesos sin los términos restrictivos que se encuentran en otras licencias open-source.
Requisitos de hardware significativos: Alojar el model de 1,02T parámetros localmente requiere clusters de múltiples GPU, lo que hace que el alojamiento propio sea costoso para equipos pequeños.

Inicio rápido de API

xiaomi/mimo-v2.5-pro

Ver documentación
other SDK
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Identify logic errors in this 50,000 line codebase." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre MiMo V2.5 Pro

Mira lo que la comunidad piensa sobre MiMo V2.5 Pro

La relación velocidad-contexto en MiMo-V2.5-Pro es inmejorable para pipelines de RAG que necesitan escanear bases de código completas de una sola vez.
u/DevBuilder
reddit
China acaba de igualar la IA de codificación de frontera de EE. UU. con un coste de tokens entre un 40 y un 60% menor. Esto no es incremental, está cambiando las reglas del juego.
Shruti
twitter
MiMo-V2.5-Pro resolvió problemas que llevarían semanas a expertos humanos. Construyó un compilador completo en poco más de 4 horas.
TechCrunchy
twitter
El valor del model no está solo en los benchmarks, sino en su capacidad para mantener flujos de trabajo de agentes complejos sin romperse.
Equipo de XiaomiMiMo
hackernews
La velocidad es bastante decente para un model de 1T. El enrutamiento MoE está haciendo gran parte del trabajo pesado aquí.
AIExplorer
reddit
Por fin un model con licencia MIT que realmente compite con los gigantes closed-source. El despliegue local es el siguiente obstáculo.
OpenSourceFan
twitter

Videos sobre MiMo V2.5 Pro

Mira tutoriales, reseñas y discusiones sobre MiMo V2.5 Pro

Nunca había visto ese nivel de detalle en un resultado... mira el suelo de madera.

El model es muy confiable y eficaz cuando le das mensajes de error técnicos específicos.

Maneja todo el contexto de la base de código sin la habitual pérdida de información en el medio del documento.

El proceso de pensamiento es transparente y muestra exactamente cómo evalúa las distintas opciones de herramientas.

Este model supera a sus predecesores en el seguimiento estricto de instrucciones para salidas JSON.

Está diseñado para manejar flujos de trabajo complejos de múltiples pasos, manteniendo miles de llamadas a herramientas.

Utiliza entre un 40 y un 60% menos de tokens que modelos como GPT-5.4 o Claude Opus 4.6 con un rendimiento similar.

Xiaomi acaba de sorprender al sector de la IA open-source con este lanzamiento.

La multimodalidad nativa significa que no necesita un codificador de visión separado para el video.

Puedes construir eficazmente todo un componente de sistema operativo proporcionando los hooks de entorno adecuados.

Mimo salió para superar a todos... el primer mes del plan de codificación cuesta solo seis dólares.

Los benchmarks solo cuentan una parte de la historia; quiero que sean constructores reales y pongan el tejado correctamente.

Es mucho más estable que la versión anterior V2 al manejar largas cadenas de reasoning.

El precio de su API nativa es agresivo, probablemente para capturar el mercado de desarrolladores.

Tiene ligeras dificultades con audio de muy alta frecuencia, pero maneja el habla conversacional a la perfección.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para MiMo V2.5 Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de MiMo V2.5 Pro.

Gestionar la latency del chain-of-thought

Añade "don't overthink" a tu prompt para reducir la latency de reasoning en consultas técnicas sencillas.

Preservar el contenido de reasoning

Envía de vuelta el reasoning_content previo en conversaciones de varios turnos para mantener el rendimiento agentic.

Definir las capacidades del entorno

Especifica claramente las capacidades del entorno de herramientas, ya que el model está optimizado para reconocer el entorno de ejecución.

Optimizar el despliegue local

Utiliza pesos de precisión mixta FP8 para equilibrar la eficiencia de memoria con un alto throughput de salida.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
alibaba

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context
$1.20/$6.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
deepseek

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context
$1.74/$3.48/1M

Preguntas Frecuentes Sobre MiMo V2.5 Pro

Encuentra respuestas a preguntas comunes sobre MiMo V2.5 Pro