minimax

MiniMax M2.5

MiniMax M2.5 es un model MoE SOTA con un context window de 1M y capacidades de programación agentic de élite a precios disruptivos para agentes autónomos.

IA agenticArquitectura MoEEspecialista en programaciónEficiencia de costes
minimax logominimaxMiniMax M-Series12 de febrero de 2026
Contexto
1.0Mtokens
Salida máx.
128Ktokens
Precio entrada
$0.30/ 1M
Precio salida
$1.20/ 1M
Modalidad:TextImage
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
62%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). MiniMax M2.5 obtuvo 62% en este benchmark.
HLE
28%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. MiniMax M2.5 obtuvo 28% en este benchmark.
MMLU
85%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. MiniMax M2.5 obtuvo 85% en este benchmark.
MMLU Pro
76.5%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. MiniMax M2.5 obtuvo 76.5% en este benchmark.
SimpleQA
44%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. MiniMax M2.5 obtuvo 44% en este benchmark.
IFEval
87.5%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. MiniMax M2.5 obtuvo 87.5% en este benchmark.
AIME 2025
45%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. MiniMax M2.5 obtuvo 45% en este benchmark.
MATH
72%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. MiniMax M2.5 obtuvo 72% en este benchmark.
GSM8k
95.8%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. MiniMax M2.5 obtuvo 95.8% en este benchmark.
MGSM
92.4%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. MiniMax M2.5 obtuvo 92.4% en este benchmark.
MathVista
65%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. MiniMax M2.5 obtuvo 65% en este benchmark.
SWE-Bench
80.2%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). MiniMax M2.5 obtuvo 80.2% en este benchmark.
HumanEval
89.6%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. MiniMax M2.5 obtuvo 89.6% en este benchmark.
LiveCodeBench
65%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. MiniMax M2.5 obtuvo 65% en este benchmark.
MMMU
68%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. MiniMax M2.5 obtuvo 68% en este benchmark.
MMMU Pro
54%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. MiniMax M2.5 obtuvo 54% en este benchmark.
ChartQA
88%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. MiniMax M2.5 obtuvo 88% en este benchmark.
DocVQA
93.2%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. MiniMax M2.5 obtuvo 93.2% en este benchmark.
Terminal-Bench
52%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. MiniMax M2.5 obtuvo 52% en este benchmark.
ARC-AGI
12%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. MiniMax M2.5 obtuvo 12% en este benchmark.

Acerca de MiniMax M2.5

Conoce las capacidades, características y formas de uso de MiniMax M2.5.

Inteligencia Frontier de alta eficiencia

MiniMax M2.5 representa un gran avance en la eficiencia de la IA de clase frontier model. Como model de tipo Mixture-of-Experts (MoE), utiliza una arquitectura dispersa con 230 mil millones de parameters totales, pero solo activa 10 mil millones de parameters por token. Este diseño le permite ofrecer un rendimiento competitivo con los flagship modelos globales, siendo significativamente más rápido y económico de operar. Lanzado a principios de 2026, está optimizado específicamente para cargas de trabajo "agentic" donde la IA debe planificar, ejecutar y autocorregirse en tareas de varios pasos.

Reasoning arquitectónico y programación

Una de las características más distintivas de M2.5 es su pensamiento arquitectónico emergente. A diferencia de los LLM estándar que generan código de forma lineal, M2.5 está entrenado para diseñar jerarquías de proyectos y estructuras lógicas antes de escribir los archivos. Esta capacidad, combinada con un context window de 1 millón de tokens, lo convierte en una opción de primer nivel para la ingeniería de software autónoma, revisiones de código a gran escala y gestión de repositorios complejos. Admite más de 10 lenguajes de programación y cuenta con un throughput nativo de hasta 100 tokens por segundo.

MiniMax M2.5

Casos de uso de MiniMax M2.5

Descubre las diferentes formas de usar MiniMax M2.5 para lograr excelentes resultados.

Ingeniería de software agentic

Generación y prueba autónoma de proyectos de varios archivos dentro de entornos sandbox utilizando el modo Architect.

Automatización de oficina de alta precisión

Ejecución de tareas complejas en Word, PowerPoint y Excel, incluyendo modelado financiero profesional.

Investigación web autónoma

Navegación por páginas web densas en información para realizar búsquedas y síntesis de información de nivel experto.

Soporte técnico bilingüe

Fluidez nativa tanto en chino como en inglés para debugging complejo y planificación arquitectónica.

Prototipado de simulaciones 3D

Generación de entornos 3D funcionales y componentes interactivos como Three.js en un solo intento.

Revisión de código empresarial

Realización de revisiones exhaustivas de código y pruebas de sistema en más de 10 lenguajes de programación con supervisión arquitectónica.

Fortalezas

Limitaciones

Eficiencia de costes disruptiva: Con un precio de 0,30 $/1,20 $ por cada millón de tokens, ofrece una inteligencia de élite por una fracción del precio de los competidores globales.
Errores lógicos ocasionales: El código inicial generado en un solo intento puede contener errores funcionales, como inconsistencias lógicas en animaciones complejas.
Planificación arquitectónica: El model muestra una capacidad única para diseñar jerarquías de proyectos y estructuras lógicas antes de generar código.
Latencia geográfica: Los usuarios fuera de la región de Asia-Pacífico pueden experimentar una mayor latency sin centros de despliegue locales en el edge.
Velocidad de inference extrema: El servicio nativo a 100 TPS lo convierte en uno de los modelos de clase frontier model más rápidos para flujos de trabajo interactivos.
Brechas en conocimiento general: Aunque es técnicamente preciso, ocasionalmente puede tener dificultades con la alineación precisa de objetos del mundo real en generaciones 3D de nicho.
Rendimiento de programación de élite: Optimizado específicamente para la ingeniería de software del mundo real, logrando un 80,2% en SWE-Bench Verified.
Sensibilidad a las instrucciones: Puede ignorar las restricciones de 'archivo único' para tareas complejas a menos que se le indique muy específicamente para evitar la dispersión en varios archivos.

Inicio rápido de API

minimax/minimax-m2.5

Ver documentación
minimax SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MINIMAX_API_KEY,
  baseURL: "https://api.minimax.chat/v1",
});

async function main() {
  const response = await client.chat.completions.create({
    model: "minimax-m2.5",
    messages: [{ role: "user", content: "Plan like an architect and code a 3D Formula 1 car drifting." }],
  });
  console.log(response.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre MiniMax M2.5

Mira lo que la comunidad piensa sobre MiniMax M2.5

"MiniMax M2.5 es un model agentic y de programación de primer nivel, mucho más rápido y drásticamente más barato."
WorldofAI
youtube
"La velocidad de M2.5 se multiplica rápidamente en los bucles de agentes. Está diseñado específicamente para cargas de trabajo de producción siempre activas."
MarketingNetMind
reddit
"Se siente más como un ayudante incansable que como un bot lento. La velocidad es un verdadero cambio de juego para mi configuración."
bruckout
reddit
"Esto parece un verdadero cambio de juego... el coste es una décima parte del de los flagship modelos propietarios."
Techmeme
facebook
"Alcanza el 80,2% en SWE Bench Verified. Este es un cambio de orden de magnitud para la economía de los agentes."
jackhnels
x
"El modo de planificación arquitectónica finalmente está haciendo que los agentes de programación autónomos sean lo suficientemente fiables para los equipos de desarrollo."
logic_pro
hackernews

Videos sobre MiniMax M2.5

Mira tutoriales, reseñas y discusiones sobre MiniMax M2.5

Finalmente hace que la idea de que la inteligencia sea demasiado barata como para medirla sea realmente realista".

La calidad definitivamente está ahí... notablemente funcional incluso para animaciones frontend complejas".

Este model se está merendando los benchmark de programación en este momento".

Su capacidad de autocorregirse durante el bucle agentic es lo que lo diferencia de M2.1".

No he visto este nivel de relación precio-rendimiento en ningún otro lanzamiento este año".

Una mejora significativa respecto a generaciones anteriores es la capacidad de M2.5 para pensar y planificar como un arquitecto".

Esta herramienta va a resultar ser un agente de programación muy, muy potente".

Fíjate en cómo desglosa la estructura de carpetas antes de escribir los componentes de React reales".

Las capacidades de reasoning aquí están muy por encima de su peso en parameters activos".

Si estás construyendo agentes de desarrollo autónomos, necesitas probar este model inmediatamente".

Si quieres usar esto para tu propio flujo de trabajo, probablemente obtendrías muy buenos resultados para programar".

Ciertamente no se están quedando atrás... se están acercando en términos de rendimiento general".

El soporte de visión multimodal maneja wireframes de UI complejos mejor que algunos modelos propietarios".

Estamos viendo una tendencia donde la velocidad se está volviendo tan importante como la inteligencia pura para los agentes".

M2.5 representa la maduración del ecosistema MiniMax para desarrolladores globales".

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para MiniMax M2.5

Consejos de expertos para ayudarte a sacar el máximo provecho de MiniMax M2.5.

Aprovecha el Architect Mode

Dale un prompt al model explícitamente para que 'planifique como un arquitecto' para activar su reasoning más profundo y la descomposición de la estructura de archivos.

Usa feedback iterativo

Para animaciones complejas en 3D o SVG, proporciona feedback sobre errores funcionales para aprovechar la autocorrección agentic del model.

Gestiona el prompt caching

Aprovecha el context window de 1M almacenando en caché conjuntos de documentación extensos para reducir los costes hasta en un 90%.

Cambia a la versión Lightning

Utiliza la versión Lightning para programación de UI interactiva en tiempo real para alcanzar velocidades de 100 TPS.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
other

PixVerse-R1

Other

PixVerse-R1 is a next-gen real-time world model by AIsphere, offering interactive 1080p video generation with instant response and physics-aware continuity.

Preguntas Frecuentes Sobre MiniMax M2.5

Encuentra respuestas a preguntas comunes sobre MiniMax M2.5