¿Cuál es el precio de MiMo V2.5 Pro?

El precio es de $1.00 por cada millón de tokens de entrada y $3.00 por cada millón de tokens de salida en la plataforma oficial. Esta estructura es significativamente más asequible que los modelos closed-source como GPT-5.4 para tareas de generación.

¿Cómo accedo a la API de MiMo V2.5 Pro?

El acceso se proporciona a través de la plataforma abierta Xiaomi MiMo API con encabezados compatibles con el OpenAI SDK. También está disponible a través de agregadores de terceros como OpenRouter.

¿Cuál es el tamaño de la context window?

El model admite una context window de 1.048.576 tokens. Esto permite a los usuarios introducir bibliotecas enteras o varias horas de contenido de video en un solo prompt.

¿Cómo se compara con los frontier models closed-source?

Iguala o supera a modelos como Claude Opus 4.6 en SWE-Bench Verified y tareas agentic. Logró estos resultados consumiendo aproximadamente un 40% menos de tokens por trayectoria.

¿Es compatible con entrada multimodal nativa?

Sí, es un agente multimodal nativo que acepta entradas de texto, imagen, audio y video. Razona sobre estos tipos de datos directamente sin requerir un preprocesamiento externo.

¿Cuál es la licencia del model?

MiMo V2.5 Pro se publica bajo la Licencia MIT. Esto permite su uso comercial, modificación y redistribución sin restricciones.

¿Puedo usar function calling?

Sí, admite llamadas a funciones (function calling) confiables y está optimizado para el uso de herramientas en múltiples turnos. Mantiene la coherencia en secuencias que superan las 1.000 llamadas a herramientas en entornos de software.

¿Qué hardware se necesita para el alojamiento local?

El alojamiento local requiere hardware de nivel empresarial debido a su recuento de 1,02T parámetros. Los desarrolladores deben utilizar clusters de múltiples GPU y pesos de precisión FP8 para mayor eficiencia.

MiMo V2.5 Pro

MiMo V2.5 Pro es el model open-source de 1,02T de parámetros MoE de Xiaomi, con una context window de 1M, multimodalidad nativa y un rendimiento de...

Open SourceAgentic AIMultimodal1M ContextXiaomi

otherMiMo27 de abril de 2026

Contexto

1.0Mtokens

Salida máx.

131Ktokens

Precio entrada

$1.00/ 1M

Precio salida

$3.00/ 1M

Modalidad:TextImageAudioVideo

Capacidades:VisiónHerramientasStreamingRazonamiento

Benchmarks

GPQA

54%

HLE

48%

MMLU

86.7%

MMLU Pro

84.9%

SimpleQA

45%

IFEval

88%

AIME 2025

41%

MATH

75%

GSM8k

95.5%

MGSM

92%

MathVista

65%

SWE-Bench

78.9%

HumanEval

90%

LiveCodeBench

80.6%

MMMU

73%

MMMU Pro

52%

ChartQA

89%

DocVQA

93.5%

Terminal-Bench

68.4%

ARC-AGI

Ver documentación API

Acerca de MiMo V2.5 Pro

Conoce las capacidades, características y formas de uso de MiMo V2.5 Pro.

MiMo V2.5 Pro es el flagship model open-source de Xiaomi. Utiliza una arquitectura de Mixture-of-Experts de 1,02 billones de parámetros, donde 42 mil millones de parámetros están activos durante la inference. El diseño de atención híbrida combina la atención de ventana deslizante local (Local Sliding Window Attention) y la atención global en una proporción de 6:1. Esta configuración específica reduce los requisitos de almacenamiento de KV-cache casi 7 veces en comparación con los modelos transformer estándar.

El model maneja una context window de 1 millón de tokens mientras admite entradas omnimodales nativas que incluyen texto, imagen, audio y video. Está optimizado para tareas agentic de largo horizonte y uso autónomo de herramientas. Los desarrolladores pueden ejecutar el model localmente utilizando pesos de precisión FP8, que equilibran el uso de memoria con el throughput de salida. La licencia MIT permisiva permite la modificación y el despliegue comercial sin tarifas adicionales.

Casos de uso de MiMo V2.5 Pro

Descubre las diferentes formas de usar MiMo V2.5 Pro para lograr excelentes resultados.

Ingeniería de software autónoma

Resolución de problemas en GitHub y creación de componentes del sistema, como compiladores, con lógica de autocorrección.

Flujos de trabajo de agente de largo horizonte

Ejecución de planes que requieren coherencia a lo largo de más de 1.000 llamadas a herramientas en entornos de software.

Análisis multimodal nativo

Razonamiento directo sobre entradas combinadas de video y texto sin necesidad de preprocesamiento externo o extracción de fotogramas.

Navegación de bases de código a gran escala

Ingesta de repositorios completos de proyectos dentro de la context window de 1M de tokens para refactorizar lógica o encontrar errores.

Diseño de circuitos analógicos

Optimización de circuitos complejos mediante la interacción con bucles de simulación para cumplir especificaciones de múltiples métricas.

Generación web 3D

Creación de entornos sofisticados y simulaciones físicas utilizando Three.js y generación procedimental de terreno.

Fortalezas

Limitaciones

Bajo consumo de tokens: Ofrece una inteligencia igual a la de los frontier models mientras utiliza entre un 40% y un 60% menos de tokens por trayectoria de tarea.

Latency de reasoning: El modo de pensamiento profundo puede provocar retrasos de varios minutos antes de que el model comience a generar texto.

Coherencia de largo horizonte: Mantiene la precisión en el reasoning a través de context windows de 1 millón de tokens y secuencias de más de 1.000 llamadas a herramientas.

Acceso complejo a la plataforma: El portal web oficial tiene un proceso de inicio de sesión inestable que los usuarios suelen describir como difícil de navegar.

Rendimiento en ingeniería de software: Alcanza una puntuación del 78,9% en SWE-bench Verified, lo que indica una alta competencia en la resolución de problemas de código de nivel GitHub.

Patrones de rechazo por seguridad: Pueden ocurrir rechazos ocasionales al final de ciclos largos de pensamiento, lo que consume tiempo de cómputo sin proporcionar una salida.

Licencia MIT permisiva: Permite la integración comercial y la modificación de pesos sin los términos restrictivos que se encuentran en otras licencias open-source.

Requisitos de hardware significativos: Alojar el model de 1,02T parámetros localmente requiere clusters de múltiples GPU, lo que hace que el alojamiento propio sea costoso para equipos pequeños.

Inicio rápido de API

xiaomi/mimo-v2.5-pro

Ver documentación

other SDK

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.xiaomimimo.com/v1",
  apiKey: process.env.MIMO_API_KEY
});

const completion = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "Identify logic errors in this 50,000 line codebase." }],
  thinking: { type: "enabled" }
});

console.log(completion.choices[0].message.content);

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre MiMo V2.5 Pro

Mira lo que la comunidad piensa sobre MiMo V2.5 Pro

“La relación velocidad-contexto en MiMo-V2.5-Pro es inmejorable para pipelines de RAG que necesitan escanear bases de código completas de una sola vez.”

— u/DevBuilder

“China acaba de igualar la IA de codificación de frontera de EE. UU. con un coste de tokens entre un 40 y un 60% menor. Esto no es incremental, está cambiando las reglas del juego.”

— Shruti

twitter

“MiMo-V2.5-Pro resolvió problemas que llevarían semanas a expertos humanos. Construyó un compilador completo en poco más de 4 horas.”

— TechCrunchy

twitter

“El valor del model no está solo en los benchmarks, sino en su capacidad para mantener flujos de trabajo de agentes complejos sin romperse.”

— Equipo de XiaomiMiMo

hackernews

“La velocidad es bastante decente para un model de 1T. El enrutamiento MoE está haciendo gran parte del trabajo pesado aquí.”

— AIExplorer

“Por fin un model con licencia MIT que realmente compite con los gigantes closed-source. El despliegue local es el siguiente obstáculo.”

— OpenSourceFan

twitter

Videos sobre MiMo V2.5 Pro

Mira tutoriales, reseñas y discusiones sobre MiMo V2.5 Pro

“Nunca había visto ese nivel de detalle en un resultado... mira el suelo de madera.”

“El model es muy confiable y eficaz cuando le das mensajes de error técnicos específicos.”

“Maneja todo el contexto de la base de código sin la habitual pérdida de información en el medio del documento.”

“El proceso de pensamiento es transparente y muestra exactamente cómo evalúa las distintas opciones de herramientas.”

“Este model supera a sus predecesores en el seguimiento estricto de instrucciones para salidas JSON.”

“Está diseñado para manejar flujos de trabajo complejos de múltiples pasos, manteniendo miles de llamadas a herramientas.”

“Utiliza entre un 40 y un 60% menos de tokens que modelos como GPT-5.4 o Claude Opus 4.6 con un rendimiento similar.”

“Xiaomi acaba de sorprender al sector de la IA open-source con este lanzamiento.”

“La multimodalidad nativa significa que no necesita un codificador de visión separado para el video.”

“Puedes construir eficazmente todo un componente de sistema operativo proporcionando los hooks de entorno adecuados.”

“Mimo salió para superar a todos... el primer mes del plan de codificación cuesta solo seis dólares.”

“Los benchmarks solo cuentan una parte de la historia; quiero que sean constructores reales y pongan el tejado correctamente.”

“Es mucho más estable que la versión anterior V2 al manejar largas cadenas de reasoning.”

“El precio de su API nativa es agresivo, probablemente para capturar el mercado de desarrolladores.”

“Tiene ligeras dificultades con audio de muy alta frecuencia, pero maneja el habla conversacional a la perfección.”

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA

Automatización Web

Flujos Inteligentes

Comenzar Gratis

Consejos Pro para MiMo V2.5 Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de MiMo V2.5 Pro.

Gestionar la latency del chain-of-thought

Añade "don't overthink" a tu prompt para reducir la latency de reasoning en consultas técnicas sencillas.

Preservar el contenido de reasoning

Envía de vuelta el reasoning_content previo en conversaciones de varios turnos para mantener el rendimiento agentic.

Definir las capacidades del entorno

Especifica claramente las capacidades del entorno de herramientas, ya que el model está optimizado para reconocer el entorno de ejecución.

Optimizar el despliegue local

Utiliza pesos de precisión mixta FP8 para equilibrar la eficiencia de memoria con un alto throughput de salida.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context

$0.28/$0.42/1M

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context

$0.15/$1.20/1M

Kimi K2.7 Code

Moonshot

Kimi K2.7 Code is a 1T parameter MoE model from Moonshot AI. It features a 262k context window and 30% more efficient reasoning for software engineering.

262K context

$0.95/$4.00/1M

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context

$0.60/$2.20/1M

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context

$0.12/$0.75/1M

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context

$0.15/$0.60/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GLM-5.2

Zhipu (GLM)

GLM-5.2 is Zhipu AI's flagship open-weight model featuring a 1M context window and specialized agentic coding capabilities under an MIT license.

1M context

$1.40/$4.40/1M

Preguntas Frecuentes Sobre MiMo V2.5 Pro

Encuentra respuestas a preguntas comunes sobre MiMo V2.5 Pro